Zdravotnické zařízení je schopno vyprodukovat značné množství dat. Denní přírůstek může dosahovat až několika gigabytů.
Nemocniční informační systém (dále také "NIS") vytváří a shromažďuje data nejen v textové podobě, ale i v různých multimediálních formátech. Objem dat, jejich různorodost a požadavek na online zpracování a analýzu je činí předmětem problematiky BIG DATA.
Tento příspěvek se zaměřuje na rozdělení dat v NIS, optimalizaci metod pro jejich zpracovaní a nalezení nejvhodnější postupů pro jejich analýzu. Primárním nositelem informace je textová lékařská dokumentace ve strukturované i nestrukturované podobě.
Zvláštní zřetel je proto věnován odlišnostem obou forem při jejich obsahové analýze.