Charles Explorer logo
🇨🇿

Rekonstrukce standardizovaného textu z mluvené řeči

Publikace na Matematicko-fyzikální fakulta |
2008

Abstrakt

Příspěvek shrnuje dosavadní poznatky získané při budování Pražského závislostního korpusu mluvené češtiny (Prague Dependency Treebank of Spoken Czech; dále PDTSC) v Ústavu formální a aplikované lingvistiky MFF UK. PDTSC bude prvním korpusem mluvené řeči, který nabídne i syntakticko-sémantickou anotaci promluv.

Východiskem projektu PDTSC je syntakticko-sémantická anotace korpusu psaných textů, která již byla zpracována v projektu Pražského závislostního korpusu 2.0 (dále PDT).