V akad. roce 2021/22 bude kurs vyučov án v následujících datech: I. blok (GLM; 31.1. B14, 1.2. B11), III. blok (GLS; 7.-8.2. Seminarium kat. botaniky, BB), II. blok (LMM, GLMM; 16.-17.5. Seminarium kat. botaniky, BB)
Rozvržení jednotlivých dvoudenních bloků: * 1. blok - Zobecněné lineární modely (GLM) a úvod do hierarchických designů 1. den dopoledne Teorie (cca 2 h) - Úvod do GLM, pojmy deviance, spojovací funkce atd., úvod do logistické regrese Cvičení (cca 1 h) - logistická regrese, její předpoklady, interpretace, konstrukce konfidečních intervalů logistické křivky 1. den odpoledne Teorie (cca 1 h) - GLM s binomickým a Poissonovým rozdělením, overdisperse Cvičení (cca 3 h) - praktické úlohy na poissonovské a binomické GLM, interpretace diagnostických grafů, detekce overdisperse a její vyřešení 2. den dopoledne Teorie (cca 1 h) - GLM s gama rozdělením, jiné než kanonické spojovací funkce Cvičení (cca 2 h) - praktické úlohy na GLM z celého spektra doposud probíraných variant 2. den odpoledne Teorie (cca 1 h) - Hierarchické designy dat a hierarchická ANOVA (split-plot, hierarchická ANOVA s.s.) Cvičení (cca 1,5 h) - Identifikace jednotlivých hladin hierarchických designů, praktické provedení hierarchických ANOV, pomocné lineární modely pro ověření předpokladů Teorie (cca 1,5 h) - Opakování konceptu faktorů s náhodným efektem a úvod do lineárních modelů se smíšenými efekty Domácí úloha: analysa dvou datových souborů zaměřených na použití GLM * 2. blok - Modely se smíšenými efekty - lineární (LME) i zobecněné lineární (GLMM) 1. den dopoledne Teorie (cca 1 h) - LME - pokračování, interpretace LME, úvod do testování LME Cvičení (cca 2 h) - LME s jedním náhodným efektem, úvod do testování faktorů s pevnými efekty, interpretace výsledků LME 1. den odpoledne Teorie (cca 1 h) - LME - pokračování, rozdíly mezi faktorem s náhodným efektem a faktorem se smíšeným efektem, testování faktorů s náhodným efektem v LME Cvičení (cca 3 h) - LME s více faktory s náhodnými a smíšenými efekty 2. den dopoledne Teorie (cca 1 h) - konstrukce konfidenčních intervalů v LME - profilování modelu a jiné metody konstrukce, vyjádření množství vysvětlené variability v rámci LME (pseudo-R2) Cvičení (cca 2 h) - konstrukce konfidenčních intervalů pro LME, výpočet psuedo-R2 2. den odpoledne Teorie (cca 1 h) - přechod od LME ke GLMM, obvyklé problémy při práci s modely se smíšenými efekty a jak se s nimi vyrovnat Cvičení (cca 3 h) - úlohy na GLMM a opakovací úlohy k modelům se smíšenými efekty Domácí úloha: analysa dvou datových souborů s hierarchickým designem * 3. blok - Data s časovou, prostorovou či fylogenetickou korelací mezi pozorováními - metoda Generalised Least Squares (GLS) 1. den dopoledne Teorie (cca 1 h) - Úvod do GLS, možnost využití pro heteroskedastická data, úvod do časové a prostorové autokorelace dat, analysy časových řad, detekce prostorové autokorelace dat (semivariogramy), funkce použitelné k aproximaci semivariogramu Cvičení (cca 2 h) - GLS s váhami (heteroskedasticita), autoregresivní modely 1. řádu, ARIMA modely, datové soubory s prostorovou autokorelací dat 1. den odpoledne Teorie (cca 1 h) - Úvod do práce s fylogenetickými daty, modely evoluce znaků, fylogeneticky nezávislé konstrasty (PIC) Cvičení (cca 3 h) - nahrávání a úpravy dat o fylogenesi, mapování znaků na fylogenetické stromy, analysy datových souborů pomocí PIC 2. den dopoledne Teorie (cca 1 h) - Fylogenetické GLS (pGLS) a převedení fylogenetického stromu do struktury varianční-kovarianční matice, fylogenetická RMA (reduced major axis regression) Cvičení (cca 2 h) - analysy datových souborů s dostupnými daty o fylogenesi 2. den odpoledne Teorie (cca 0,5 h) - Fylogenetická analysa hlavních komponent (phylPCA) Cvičení (cca 1,5 h) - pokračování úloh z dopoledne + phylPCA Cvičení (cca 2 h) - diskuse zadání modelových úloh se zaměřením na identifikaci povahy dat a výběr vhodné analytické techniky
Domácí úloha: analysa dvou datových souborů sčasově, prosotorově, nebo fylogeneticky kroelovanými závislými proměnnými
Předmět si klade za cíl seznámit s studenty a naučit je prakticky používat výběr nejčastější pokročilých technik statistické analysy dat. Předmět je koncipován jako pokračování předmětu Biostatistika a plánování pokusů
(MB120P163), která je prerekvisitou. V odůvodněných případech (např. absolvování analogické přednášky) budou vyučující ochotni povolit zápis i bez prerekvisity. Předmět bude organisován ve třech dvoudenních blocích přednášek a cvičení – 1) nenormálně rozdělené závislé proměnné – zobecněné lineární modely (GLM); 2) hierarchické designy - modely se smíšenými efekty (LME, GLMM) a hierarchické ANOVy (split-plot, nested
ANOVA); 3) modely pracující s časovou, prostorovou či fylogenetickou korelací pozorování závislé proměnné – metoda zobecněných nejmenších čtverců (GLS, PGLS).