Charles Explorer logo
🇨🇿

Korpus spontánní mluvené češtiny ORAL2013

Publikace na Filozofická fakulta |
2015

Abstrakt

Příspěvek představuje korpus spontánní mluvené češtiny ORAL2013, jeho složení i praktické aspekty jeho tvorby. Korpus je navržen jako reprezentace současného spontánního mluveného jazyka užívaného v neformálních každodenních situacích na území celé České republiky.

Korpus se skládá z nahrávek a jejich přepisů zarovnaných se zvukem pomocí časových značek, vyznačuje se pečlivou anotací a širokým regionálním pokrytím velkého množství mluvčích. ORAL2013 obsahuje 835 nahrávek z let 2008-2011 s celkem 2 544 mluvčími (z toho 1 297 jsou různí mluvčí), celková délka nahrávek činí téměř 300 hodin a objem přepsaného materiálu přesahuje 3,28 mil. slovních tvarů (tokens).

ORAL2013 je veřejně přístupný v rámci projektu Český národní korpus na adrese http://www.korpus.cz/.