Monday, May 29, 2017 -
13:30 to 14:15
Room: 

Modelování slovotvorných vztahů ve slovní zásobě češtiny

V příspěvku budu informovat o pokrocích ve vývoji lexikální databáze DeriNet a rozeberu tři témata, kterým je v rámci projektu aktuálně věnována významná pozornost. Databáze DeriNet je jako jazykový zdroj specializovaný na derivační morfologii češtiny budována v Ústavu formální a aplikované lingvistiky MFF UK, mezi více než 1 milionem lexémů se zatím podařilo identifikovat 774 tisíc derivačních vztahů. Prvním z témat probíraných v příspěvku jsou hláskové alternace, které jsou pro poloautomatické metody identifikace derivačních vztahů zásadním problémem. Dále se zaměřím na kategorii slovesného vidu, tato flektivní kategorie českého slovesa je vyjadřována slovotvornými prostředky. Kategorie vidu byla spolu s dalšími rysy použita jako jedno z kritérií při uspořádávání příbuzných sloves do derivačního stromu. V závěru příspěvku - jako téma třetí - bude zachycování sloves odvozených od sloves představeno komplexně. Všechna tři témata jsou vzájemně provázána, ve všech jsou úzce propojeny aspekty teoretické a komputační lingvistiky.