Základy deskriptivní a inferenční statistiky: Kompletní průvodce
Testování hypotéz je sada principů a postupů, pomocí nichž posuzujeme, zda pozorovaná data podporují určité tvrzení o populaci (např. o parametru, vztahu mezi proměnnými nebo účinku zásahu). Cílem je učinit rozhodnutí na základě dat při zohlednění náhodné variability a nejistoty.
Definice: Test hypotéz je formální postup, který porovnává pozorovaná data s očekáváním plynoucím z nulové hypotézy H₀ za účelem rozhodnutí, zda H₀ zamítnout nebo ji nezamítnout.
Definice: H₀ a H₁ tvoří vzájemně se doplňující dvojici hypotéz; testy jsou navrženy tak, aby posoudily konzistenci dat s H₀.
Definice: Testová statistika shrnuje data do jediné hodnoty, podle níž rozhodujeme o zamítnutí nebo nezamítnutí H₀.
Tabulka chyb a správných rozhodnutí:
| výsledek testu | skutečnost |
|---|---|
| H₀ nezamítáme | OK (1-α) nebo chyba typu II (β) |
| H₀ zamítáme | chyba typu I (α) nebo OK (1-β) |
Definice: Hladina významnosti $\alpha$ je přijímaná pravděpodobnost chyby I. druhu.
Definice: Interval spolehlivosti (např. 95 %) je metoda, která konstruuje rozsah, z něhož přibližně daný podíl takto získaných intervalů z opakovaných vzorků bude obsahovat skutečnou hodnotu parametru.
Definice: p-hodnota = $P(\text{data stejně extrémní nebo extrémnější} \mid H_0)$.
Věnujte pozornost tomu, čím p-hodnota NENÍ:
Příklad: 100 hodů, pozorujeme 77 panna a 23 orel. Jak rozhodnout, zda mince není férová?
Postup (srozumitelně): formulovat H₀ (mince férová), zvolit statistiku (např. podíl pann), spočítat pravděpodobnost pozorování tak extrémního výsledku za H₀ (p-hodnota), porovnat s $\alpha$.
Už máš účet? Přihlásit se
Klíčová slova: Statistická analýza, Testování hypotéz, t-test
Klíčové pojmy: Formulujte H₀ a H₁ jasně a matematicky přesně, Testová statistika shrnuje data do jediné hodnoty pro rozhodnutí, p-hodnota = $P(\text{data stejně extrémní nebo extrémnější} \mid H_0)$, Chyba I. druhu je $\alpha$, chyba II. druhu je $\beta$, síla testu je $1-\beta$, Interval spolehlivosti popisuje proceduru pokrývání parametru, ne pravděpodobnost jedinečného intervalu, Reportujte test, popisné statistiky, testovou statistiku, interval, p-hodnotu a velikost účinku, Při mnohonásobném testování používejte korekce (FWER nebo FDR), Velikost účinku hodnotí praktickou významnost nezávisle na velikosti vzorku, Ověřujte předpoklady testu před aplikací, p-hodnota sama o sobě není důkazem praktické významnosti