Cílem semináře je poskytnout konkr étní zkušenost analýzy dat. V přednáškové části si studenti zopakují a rozšíří dostupné nástroje, v seminární části budeme budou aplikovat metody na konkrétní datovou sadu a sdílet zkušenosti.
Svou analýzu odevzdají ve formě semestrální práce.
Přednášky pokryjí základy pro práci:
- grafy (XY - scatterplot, krabicový - boxplot a další možnosti grafického zobrazení),
- agregace a statistiky pro skupiny,
- tvorba jednoduchých klasifikačních a regresních modelů,
- vyhodnocení vzhledem k různým chybovým funkcím,
- čištění dat (chybějící a odlehlé hodnoty).
Dle konkrétních analyzovaných dat se dále zaměříme na některá z témat:
- časové řady,
- převod textu na vektory tfidf,
- klastrování a učení pravidel (apriori).
Přednášky uvedou do možností programovacích nástrojů pro dobývání znalostí. V rámci semináře studenti postupně zpracují analýzu konkrétní větší datové sady a odevzdají jako semestrální práci.