[ Skip to the content ]

Institute of Formal and Applied Linguistics

at Faculty of Mathematics and Physics, Charles University, Prague, Czech Republic


[ Back to the navigation ]

Publication


Year 2017
Type in proceedings
Status published
Language English
Author(s) Huck, Matthias Tamchyna, Aleš Bojar, Ondřej Fraser, Alexander
Title Producing Unseen Morphological Variants in Statistical Machine Translation
Czech title Generování neviděných tvaroslovných variant ve statistickém strojovém překladu
Proceedings 2017: Stroudsburg, PA, USA: EACL 2017: Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics, volume 2: Short Papers
Pages range 369-375
How published online
Supported by 2015-2018 H2020-ICT-2014-1-644402 (Himl (Health in my Language)) 2015-2018 H2020-ICT-2014-1-645452 (QT21: Quality Translation 21) 2016-2019 LM2015071 (LINDAT-CLARIN: Institut pro analýzu, zpracování a distribuci lingvistických dat)
Czech abstract Strojový překlad do tvaroslovně bohatých jazyků představuje složitý problém. Prestože pokrytí na úrovni lemmat může být dostatečné, řada jejich tvaroslovných variant se z trénovacích dat nedá získat. Představujeme statistický překladový systém, který tyto tvaroslovné varinaty dokáže generovat. Na rozdíl od dřívějších prací nerozdělujeme modelování tvarosloví a lexikální volbu na dva navazující kroky. Náš postup je integrován přímo v dekódování a využívá informace z konextu jak na zdrojové, tak na cílové straně.
English abstract Translating into morphologically rich languages is difficult. Although the coverage of lemmas may be reasonable, many morphological variants cannot be learned from the training data. We present a statistical translation system that is able to produce these inflected word forms. Different from most previous work, we do not separate morphological prediction from lexical choice into two consecutive steps. Our approach is novel in that it is integrated in decoding and takes advantage of context information from both the source language and the target language sides.
Specialization linguistics ("jazykověda")
Confidentiality default – not confidential
Open access yes
ISBN* 978-1-945626-35-7
Address* Stroudsburg, PA, USA
Month* April
Venue* Valencia Conference Center
Publisher* Association for Computational Linguistics
Institution* Universitat Politécnica de València
Creator: Common Account
Created: 4/8/17 1:21 PM
Modifier: Common Account
Modified: 4/8/17 2:43 PM
***

Content, Design & Functionality: ÚFAL, 2006–2016. Page generated: Fri Sep 22 00:52:11 CEST 2017

[ Back to the navigation ] [ Back to the content ]

100% OpenAIRE compliant