1. Témata korpusových studií, relevance kvantitativních metod v lingvistice, stanovení hypotézy
2. Deskriptivní statistika - střední hodnota, disperze
3. Typy pravděpodobnostních rozdělení
4. Inferenční statistika
5. Korelace a regrese
6. Faktorová analýza a clusteringové metody
7. ANOVA
Pokročilejší zájemci o korpusovou lingvistiku, kteří absolvovali libovolný základní seminář práce s korpusy, mohou v rámci tohoto semináře prohloubit svoje znalosti statistického zpracování dat. Kurs je zaměřen jak na statistickou teorii (zejména otázky týkající se korpusové lingvistiky a specifických rozdělení jazykových dat) i na praktické zvládnutí nástrojů na provádění výpočtu (zejm.
R). Kurs předpokládá uživatelskou znalost práce s PC.