Charles Explorer logo
🇨🇿

Vztahy mezi segmenty ? segmentační schémata českých vět

Publikace na Matematicko-fyzikální fakulta |
2008

Abstrakt

Syntaktická analýza vět přirozeného jazyka, základní předpoklad mnoha aplikovaných úkolů, je složitá úloha, a to zejména pro jazyky s volným slovosledem. Přirozeným krokem, který snižuje složitost vstupních vět, může být vytvoření modulu, ve kterém se určí struktura souvětí ještě před úplnou syntaktickou analýzou.

Navrhujeme využít pojem segmentů, snadno automaticky rozpoznatelných úseků vět. Určujeme `segmentační schémata' popisující vzájemné vztahy mezi segmenty -- zejména souřadná a apoziční spojení, podřadná spojení, případně vsuvky.

V tomto článku představujeme vývojový rámec, který umožňuje vyvíjet a testovat pravidla pro automatické určování segmentačních schémat. Popisujeme dva základní experimenty -- experiment se získáváním segmentačních schémat ze stromů Pražského závislostního korpusu a experiment se segmentačními pravidly aplikovanými na prostý text.

Dále navrhujeme míry pro vyhodnocování úspěšnosti segmentačních pravidel.