Charles Explorer logo
🇨🇿

Korpus InterCorp, verze 12

Publikace

Abstrakt

Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 41 jazyky (včetně češtiny). V porovnání s verzí 11 se počet slov v cizojazyčných textech zvýšil na 1 534 mil., z toho 311 mil. v beletristickém jádru a 1 223 mil. ve volně dostupných kolekcích.

Počet slov v českých textech činí celkem 200 mil., z toho 111 mil. jádro a 90 mil. kolekce. Nově přibyly čínské texty, včetně slovnědruhových značek.