Charles Explorer logo
🇨🇿

STUDIUM VLIVU délky v morfologických segmentaci aglutinační JAZYKŮ

Publikace na Matematicko-fyzikální fakulta |
2012

Abstrakt

Morph délka je jedním z orientační funkce , která pomáhá učit morfologii jazyků, zejména aglutinační jazyky. V tomto článku vám představíme jednoduchý bez dozoru model pro morfologické segmentace a pozorujete, jak se znalosti morph Délka ovlivnit výkon segmentaci úkol v rámci bayesovského rámce.

Model je založen na (Goldwater et al., 2006) unigram slovo segmentace modelu a předpokládá jednoduchou distribuci přes předchozí morph délka. Jsme experimentovat tento model na dvou velmi příbuzných a aglutinační jazyky Tamil a Telugu to, a porovnávat naše výsledky s nejmodernější Morfessor systém.

Ukazujeme, že znalost morph délka má pozitivní vliv a poskytuje konkurenceschopných výsledků, pokud jde o celkový výkon.