Deltacorpus

Publication

Abstract

Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).

Keywords

deltacorpus texts languages from corpus http handle 11858 097c 0000 0022 6133 first tokens language tagged delexicalized tagger described 2016 lrec portorož slovenia

Deltacorpus

Abstract

Keywords

People