Extrakce česko-litevského slovníku z korpusu

Publikace na Filozofická fakulta |

2010

Abstrakt

V této stati je ukázána možnost extrakce obecného překladového slovníku z paralelního textového korpusu. Pro experiment byl použit lemmatizovaný česko-litevský paralelní korpus o velikosti cca 50.000 vět a softwarový nástroj NATools pro extrakci překladových ekvivalentů.

Výsledky experimentu naznačují, že tímto způsobem je možné získat základ dvoujazyčného slovníku, který je pak ovšem třeba ručně opravit a rozšířit.

Klíčová slova

Extrakce český litevský slovník korpus

Extrakce česko-litevského slovníku z korpusu

Abstrakt

Klíčová slova

Osoba