Charles Explorer logo
🇨🇿

Korpus InterCorp, verze 14

Publikace

Abstrakt

Nová verze rozsáhlého paralelního korpusu obsahujícího překlady mezi celkem 42 jazyky (včetně češtiny). V porovnání s verzí 13 se počet slov v cizojazyčných textech zvýšil na 1 572 mil., z toho 349 mil. v beletristickém jádru a 1 223 mil. ve volně dostupných kolekcích.

Počet slov v českých textech činí celkem 207 mil., z toho 118 mil. jádro a 90 mil. kolekce. Nově přibyly texty horní lužičtiny.