V této práci se věnujeme rozšíření našeho nástroje, Analyreru, pro statistickou analýzu reálných XML dat. Nejprve popíšeme návrh a implementaci systému pro analýzu XQuery programů.
Tento systém je založen na frekvenční analýze výskytu různých konstruktů. XQuery je převedeno na vhodnou XML reprezentaci, která umožní následné dotazování pomocí standardních XPath dotazů.
V druhé části prezentujeme model, který umožňuje opravy elementů a atributů s použítím jednotypových stromových gramatik. Průzkumem stavového prostoru automatu, který rozpoznává regulární výrazy, jsme schopni vždy najít všechny opravy s minimální cenou.
Tyto opravy jsou reprezentovány zanořenými multigrafy, které mohou být přeloženy do sekvencí operací, které upravují datový strom.