Průměrné zdravotnické zařízení vyprodukuje několik gigabytů elektronických dat denně. Z tohoto množství je 80 % uloženo v tzv. nestrukturované podobě, tj. bez předem dané struktury.
V minulosti bylo velmi obtížné nestrukturovaná data analyzovat, a proto byla tato data ve většině případů přehlížena. Bohužel nestrukturovaná data tvoří v nemocničních informačních systémech tak významný podíl, že jejich informační potenciál nelze nadále opomíjet.
Tento příspěvek se zaměřuje na postupy, jak získávat, zpracovávat a ve finální podobě analyzovat a zobrazovat nestrukturovaná lékařská data. Zvláštní zřetel je věnován načítání, parsování a indexování dat a tvorbě dedikovaných anotátorů pro textovou analýzu lékařských záznamů.