Charles Explorer logo
🇨🇿

Pojmenované entity v češtině: anotace dat a vývoj taggeru

Publikace na Matematicko-fyzikální fakulta |
2009

Abstrakt

Příspěvek se zabývá zpracováním pojmenovaných entit v českých textech. Představíme dvouúrovňovou klasifikaci pojmenovaných entit, která byla použita při ruční anotaci 2000 vět.

V tomto materiálu bylo identifikováno více než 11000 pojmenovaných entit. S použitím těchto dat jsme metodami strojového učení vyvinuli softwarový systém, který automaticky rozpoznává a klasifikuje pojmenované entity v českých textech.