Charles Explorer logo
🇨🇿

Vícejazyčný Závislost analýze: Použití stroje přeloženy texty místo Paralelní korpusy

Publikace na Matematicko-fyzikální fakulta |
2014

Abstrakt

Tento dokument se vrací k přístupu projekce založené na závislost gramatiky indukční úkol. Tradiční cross-kulturní závislost indukční úkoly jeden tak či onak, závisí na existenci z bitexts nebo cílového jazyka nástrojů, jako je část-of-speech (POS) značkovače, abychom získali přiměřenou analýze přesnosti.

V tomto článku jsme se přenést závislost analyzátory pomocí pouze orientační zdroje, tj, stroje přeloženy bitexts namísto ručně vytvořených bitexts. Děláme to tak, získání zdrojového stranu textu ze strojového překladu (MT) systém a pak použít Přenos přístupy k vyvolání analyzátor pro cílové jazyky.

Dále snižují potřebu Informace o dostupnosti značených cílového jazyka zdrojů pomocí voze cílové tagger. Ukázali jsme, že náš přístup stále překonává bez dozoru analyzátory o větší rozpětí (8,2% absolutní), a výsledky v podobném provedení, kdy ve srovnání s delexicalized převodem analyzátory.