Charles Explorer logo
🇨🇿

Vlastní jména v českých korpusech

Publikace na Matematicko-fyzikální fakulta |
2008

Abstrakt

Ačkoli jsou vlastní jména nedílnou součástí textů, a tedy i textových korpusů, byla jim (přinejmenším) v české korpusové lingvistice dosud věnována jen okrajová pozornost. V příspěvku představíme, jak jsou vlastní jména popsána v dostupných korpusech češtiny.

Ukážeme, že dosavadní způsob zachycení je nedostatečný, a pokusíme se proto navrhnout nový způsob jejich reprezentace. V Pražském závislostním korpusu 2.0 (PDT 2.0) by reprezentace vlastních jmen měla být součástí popisu větné sémantiky, pro tyto účely je nutné stávající anotační schéma adaptovat.