Jak se odhadují dopady vzdělávacích programů? Vliv kouření na riziko výskytu rakoviny? A jak se zkoumá, jestli má zvýšení minimální mzdy dopad na nezaměstnanost?
Cílem tohoto kurzu je pomocí těchto a dalších příkladů uvést studenty do světa kauzální inference a pokročilého statistického modelování. Kurz samotný je rozdělen do dvou části. V první části si ukážeme, jak modelovat proměnné, na které nestačí lineární regrese. V druhé části si představíme základy kauzální inference - nástrojů pro zkoumání vlivu proměnných, namísto prostých korelací. Konkrétně nás čeká: 1. část:
* Úvod do zobecněných lineárních modelů
* Modelování kategoriálních proměnných, jako je volební účast nebo voličské preference (logistická regrese)
* Modelování četností, jako je počet zameškaných hodin ve škole (Poissonovská Negativně-binomická regrese)
* Modelování proměnných v uzavřeném intervalů, jako je školní průměr nebo podíly (beta a gamma regrese) 2. část
* Uvedení do kauzální inference
* Experimentální design, využívány při evaluaci vzdělávacích politik i v marketingu
* Difference-in-differences analýza, aneb je se zkoumal vliv minimální mzdy na nezaměstnanost
* Propensity score matching/weighting a jak jej epidemiologové využívají pro zkoumání dopadů kouření nebo nošení roušek.
Po absolvování kurzu budou studenti připraveni pustit se do kvantitativní analýzy na expertní úrovni, ať už se vydají cestou akademie, soukromého sektoru nebo veřejné politiky. Kurz předpokládá uživatelskou znalost programovacího jazyka R (na úrovni kurzu Úvod do analýzy dat v R) a schopnost využívat lineární regresi (na úrovni kurzu Aplikovaná regrese v R). Studenti také budou potřebovat vlastní notebook.