Představujeme systematické srovnání předzpracovávacích metod pro dva jazykové páry: angličtina-čeština a angličtina-hindština. Přestože oba cílové jazyky patří do indoevropské jazykové rodiny, vykazují významné odlišnosti v tvarosloví, skladbě a slovosledu.
Popisujeme TectoMT, úspěšné prostředí pro analýzu a syntézu jazyka, a ukazujeme, jak ho lze využít pro předzpracování dat pro frázový systém strojového překladu.