V této stati je ukázána možnost extrakce obecného překladového slovníku z paralelního textového korpusu. Pro experiment byl použit lemmatizovaný česko-litevský paralelní korpus o velikosti cca 50.000 vět a softwarový nástroj NATools pro extrakci překladových ekvivalentů.
Výsledky experimentu naznačují, že tímto způsobem je možné získat základ dvoujazyčného slovníku, který je pak ovšem třeba ručně opravit a rozšířit.