Charles Explorer logo
🇨🇿

ORAL2008: Nový vyvážený korpus mluvené češtiny

Publikace na Filozofická fakulta |
2008

Abstrakt

Článek představuje ORAL2008, nový plně vyvážený korpus autentické mluvené češtiny o rozsahu 1 milion slov pokrývající celé území Čech. Popisuje jeho složení v kontextu dalších korpusů mluvené češtiny a použitý automatický vyvažovací algoritmus.