Morph délka je jedním z orientační funkce , která pomáhá učit morfologii jazyků, zejména aglutinační jazyky. V tomto článku vám představíme jednoduchý bez dozoru model pro morfologické segmentace a pozorujete, jak se znalosti morph Délka ovlivnit výkon segmentaci úkol v rámci bayesovského rámce.
Model je založen na (Goldwater et al., 2006) unigram slovo segmentace modelu a předpokládá jednoduchou distribuci přes předchozí morph délka. Jsme experimentovat tento model na dvou velmi příbuzných a aglutinační jazyky Tamil a Telugu to, a porovnávat naše výsledky s nejmodernější Morfessor systém.
Ukazujeme, že znalost morph délka má pozitivní vliv a poskytuje konkurenceschopných výsledků, pokud jde o celkový výkon.