Jak se odhadují dopady vzdělávacích programů? Vliv kouření na riziko výskytu rakoviny? A jak se zkoumá, jestli má zvýšení minimální mzdy dopad na nezaměstnanost?
Cílem tohoto kurzu je pomocí těchto a dalších příkladů uvést studenty do světa kauzální inference a pokročilého statistického modelování. Kurz samotný je rozdělen do dvou části. V první části si ukážeme, jak modelovat proměnné, na které nestačí lineární regrese. V druhé části si představíme základy kauzální inference - nástrojů pro zkoumání vlivu proměnných, namísto prostých korelací. Konkrétně nás čeká: 1. část:
* Úvod do zobecněných lineárních modelů
* Modelování kategoriálních proměnných, jako je volební účast nebo voličské preference (logistická regrese)
* Modelování četností, jako je počet zameškaných hodin ve škole (Poissonovská Negativně-binomická regrese)
* Modelování proměnných v uzavřeném intervalů, jako je školní průměr nebo podíly (beta a gamma regrese) 2. část
* Uvedení do kauzální inference
* Experimentální design, využívány při evaluaci vzdělávacích politik i v marketingu
* Difference-in-differences analýza, aneb je se zkoumal vliv minimální mzdy na nezaměstnanost
* Propensity score matching/weighting a jak jej epidemiologové využívají pro zkoumání dopadů kouření nebo nošení roušek.
Po absolvování kurzu budou studenti připraveni pustit se do kvantitativní analýzy na expertní úrovni, ať u ž se vydají cestou akademie, soukromého sektoru nebo veřejné politiky. Kurz předpokládá uživatelskou znalost programovacího jazyka R (na úrovni kurzu Úvod do analýzy dat v R) a schopnost využívat lineární regresi (na úrovni kurzu Aplikovaná regrese v R). Studenti také budou potřebovat vlastní notebook.