Charles Explorer logo
🇨🇿

Extrakce česko-litevského slovníku z korpusu

Publikace na Filozofická fakulta |
2010

Abstrakt

V této stati je ukázána možnost extrakce obecného překladového slovníku z paralelního textového korpusu. Pro experiment byl použit lemmatizovaný česko-litevský paralelní korpus o velikosti cca 50.000 vět a softwarový nástroj NATools pro extrakci překladových ekvivalentů.

Výsledky experimentu naznačují, že tímto způsobem je možné získat základ dvoujazyčného slovníku, který je pak ovšem třeba ručně opravit a rozšířit.