[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2016
Type article
Status published
Language English
Author(s) Martínez Alonso, Héctor Zeman, Daniel
Title Universal Dependencies for the AnCora treebanks
Czech title Universal Dependencies pro treebanky AnCora
Journal Procesamiento del Lenguaje Natural
Publisher's city and country Salamanca, Spain
Volume 57
Pages range 91-98
Month September
Note http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/issue/view/220 http://www.congresocedi.es/sepln#tabs3 http://www.congresocedi.es/en/sepln#tabs7
How published online
URL http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/5341
Supported by 2015-2017 GA15-10472S (Morfologicky a syntakticky anotované korpusy mnoha jazyků) 2012-2016 PRVOUK P46 (Informatika)
Czech abstract Tento článek popisuje konverzi katalánského a španělského treebanku AnCora do formalismu Universal Dependencies (univerzální závislosti). Popisujeme proces konverze a odhadujeme kvalitu výsledného treebanku nepřímo pomocí automatické syntaktické analýzy v jednojazykovém, mezijazykovém a mezidoménovém testu. Převedené treebanky vykazují interní konzistenci srovnatelnou s původní distribucí AnCora pro CoNLL09. Od jiného, dříve vydaného španělského UD treebanku se liší zejména v repertoáru vyznačených víceslovných výrazů. Tyto dva nově převedené treebanky budou vydány v Universal Dependencies verzi 1.3.
English abstract This article describes the conversion of the Catalan and Spanish AnCora treebanks to the Universal Dependencies formalism. We describe the conversion process and assess the quality of the resulting treebank in terms of parsing accuracy by means of monolingual, cross-lingual and cross-domain parsing evaluation. The converted treebanks show an internal consistency comparable to the one shown by the original CoNLL09 distribution of AnCora, and indicate some differences in terms of multiword expression inventory with regards to the already existing UD Spanish treebank. The two new converted treebanks will be released in version 1.3 of Universal Dependencies.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access no
Scopus EID Code 2-s2.0-84986267491
ISSN* 1135-5948
Publisher* Sociedad Española para el Procesamiento del Lenguaje Natural
Creator: Common Account
Created: 3/30/16 8:31 AM
Modifier: Almighty Admin
Modified: 2/25/17 10:07 PM
***

PDFpublic5341-4677-1-PB.pdfapplication/pdf
Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Sep 22 01:04:19 CEST 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant