[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type in proceedings
Status published
Language English
Author(s) Mareček, David
Title Delexicalized and Minimally Supervised Parsing on Universal Dependencies
Czech title Delexikalizovaný a minimálně supervizovaný parsing na Universal Dependencies
Proceedings 2016: Cham, Switzerland: SLSP 2016: Statistical Language and Speech Processing
Pages range 30-42
How published print
Supported by 2014-2016 GP14-06548P (Odvození větné struktury bez anotovaných korpusů)
Czech abstract V tomto článku budeme porovnávat delexicalized přenos a minimálně pod dohledem rozebrat techniky na 32 různých jazyků od Universal závislostí korpusu sbírky. Minimální dohled při přidávání pouštět univerzální gramatická pravidla pro POS tagy. Pravidla jsou začleněny do nekontrolované závislost parseru ve formách externích dřívějších pravděpodobnostech. Také jsme experimentovat s učit se toto pravděpodobností z jiných stromových korpusů. Průměrná připevnění skóre našeho parseru je o něco nižší než v delexicalized přenosu analyzátor, nicméně, to funguje lépe pro jazyky z méně zdroji jazykových rodin (non-Indo-Evropan), a proto je vhodný pro ty, pro které stromových korpusů často neexistují.
English abstract In this paper, we compare delexicalized transfer and minimally supervised parsing techniques on 32 different languages from Universal Dependencies treebank collection. The minimal supervision is in adding handcrafted universal grammatical rules for POS tags. The rules are incorporated into the unsupervised dependency parser in forms of external prior probabilities. We also experiment with learning this probabilities from other treebanks. The average attachment score of our parser is slightly lower then the delexicalized transfer parser, however, it performs better for languages from less resourced language families (non-Indo-European) and is therefore suitable for those, for which the treebanks often do not exist.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
DOI 10.1007/978-3-319-45925-7_3
Editor(s)* Pavel Král; Carlos Martín-Vide
ISBN* 978-3-319-45924-0
ISSN* 0302-9743
Address* Cham, Switzerland
Month* October
Venue* NTIS research centre at the Faculty of Applied Sciences of the University of West Bohemia
Publisher* Springer International Publishing
Institution* NTIS research centre at the Faculty of Applied Sciences of the University of West Bohemia
Creator: Common Account
Created: 10/18/16 10:54 AM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

Camera-ready paperpublicpaper.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Sat Nov 18 20:39:57 CET 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant