CsEnVi Pairwise Parallel Corpora je soubor dvou paralelních korpusů, anglicko-vietnamského a česko-vietnamského, sestavených z dostupných filmových titulků a titulků přednášek TED. Korpusy byly očištěny naší poloautomatickou filtrací a jsou zarovnány po větách.