Charles Explorer logo
🇨🇿

Analýza parsování pro ruštinu

Publikace na Matematicko-fyzikální fakulta |
2018

Abstrakt

Rozbalení pomocí křížových značek je založeno na nahrazení jedné vrstvy anotací za jinou při zpracování dat v jednom jazyce. Nejčastěji není k dispozici ani rodný značkovač nebo syntaktický analyzátor závislostí používaný v (před) anotaci Gold stromové banky.

Přístup přes křížové štítky umožňuje anotovat nové texty pomocí volně dostupných nástrojů nebo nástrojů optimalizovaných podle potřeb uživatele. Vyhodnocujeme robustnost analyzování ruské závislostí s použitím různých morfologických a syntaktických tagů ve vstupu a výstupu.

Kvalitativní analýza chyb ukazuje, že křížová substituce tří morfologických značek a dvou syntaktických značek způsobuje pouze mírný pokles výkonu.