Current Events
Ústav formální a aplikované lingvistiky Vás srdečně zve na
Seminář formální lingvistiky
vedený prof. E. Hajičovou. Seminář se koná v pondělí od 13:30
v budově MFF UK, Malostranské nám. 25, 4. patro, místnost S1 (č. 428).
8. 3. 2010
-
Mapping the Prague Dependency Treebank Annotation Scheme onto Robust Minimal Recursion Semantics
Max Jakob (Erasmus Mundus European Masters Program in Language and Communication Technologies, Univerzita Karlova v Praze - Universität Saarbrücken) -
The talk presents work on the correspondence between two semantic formalisms, namely the tectogrammatical layer of the Prague Dependency Treebank 2.0 (PDT) and Robust Minimal Recursion Semantics (RMRS). It is a first attempt to relate the dependency based annotation scheme of PDT to a compositional semantics approach like RMRS.
A mapping algorithm that converts PDT trees into RMRS structures was developed, associating RMRSs to each node in the dependency tree. Therefore, composition rules were formulated and the complex relation between dependency in PDT and semantic heads in RMRS was analyzed in detail. It turns out that structure and dependencies, morphological categories and some coreferences can be preserved in the target structures. Furthermore, valency and free modifications are distinguished using the valency dictionary of PDT as an additional resource.
The evaluation result of 81% recall shows that systematically correct underspecified target structures can be obtained by a rule-based mapping approach, which is an indicator that RMRS is capable of representing Czech data. This finding is novel as Czech, with its free word order and rich morphology, is typologically different from language that previously used RMRS.
15. 3. 2010
-
Jen někdy významová, avšak vždy významná: základní slovesa ve vícejazyčném porovnání na příkladech z češtiny a švédštiny
Silvie Cinková (ÚFAL MFF UK) -
Přirozený jazyk používá řádově méně sloves než substantiv. Na popis vztahů mezi entitami tedy zřejmě potřebujeme mnohem méně slov než na označení entit samotných. Navíc je za bezmála polovinou všech slovesných užití některé z nejvíce frekventovaných sloves (statistika pro švédštinu). Slovesa, která zbudou na prvních cca 50 příčkách švédského frekvenčního žebříčku při zanedbání pomocných a způsobových sloves, tvoří velmi zhruba vymezenou skupinu tzv. základních sloves. Typickou je pro ně schopnost fungovat jako tzv. lehká/operační slovesa ve verbonominálních predikátech a gramatikalizační potenciál. Sémanticky by se dala nejčastěji popsat jako slovesa pohybu, umístění a fyzické kontroly, např. stát, jít, držet a dát.
Přednáška se dotkne následujících témat: rozdíly mezi švédštinou a češtinou v konceptualizaci prostoru pomocí základních sloves (české dát vs. švédské posadit, položit, postavit), verbonominální predikáty jako prostředek k vyjádření vidu a způsobu slovesného děje ve švédštině, další zajímavá gramatikalizovaná užití některých základních sloves, překvapivé mezijazykové rozdíly v kolokačním potenciálu ekvivalentů základních sloves, (nikterak překvapivá) jazyková specifičnost metaforických posunů pro vyjádření abstraktních vztahů pomocí základních sloves.
Tato témata budou pojednána z hlediska teoretických i ryze praktických metodologických přístupů: emergentní gramatika, lexikální funkce, funkční generativní popis, teorie norem a exploatací a automatická kolokační analýza. Závěrem budou krátce diskutovány možnosti formalizovaného lexikálního popisu základních švédských sloves pro pokročilé české studenty švédštiny.
V přednášce budou všechny švédské příklady přeloženy do češtiny.

