Shrnutí na Základy deskriptivní a inferenční statistiky

Základy deskriptivní a inferenční statistiky: Kompletní průvodce

Shrnutí Test znalostí Kartičky Podcast Myšlenková mapa

Úvod

Testování hypotéz je sada principů a postupů, pomocí nichž posuzujeme, zda pozorovaná data podporují určité tvrzení o populaci (např. o parametru, vztahu mezi proměnnými nebo účinku zásahu). Cílem je učinit rozhodnutí na základě dat při zohlednění náhodné variability a nejistoty.

Definice: Test hypotéz je formální postup, který porovnává pozorovaná data s očekáváním plynoucím z nulové hypotézy H₀ za účelem rozhodnutí, zda H₀ zamítnout nebo ji nezamítnout.

Základní pojmy

Nulová a alternativní hypotéza

H₀ (nulová hypotéza): obvykle tvrzení „bez efektu“ nebo „bez rozdílu“. Příklad: průměr populace se rovná určité hodnotě.
H₁ (alternativní hypotéza): opak H₀, tj. existuje efekt nebo rozdíl.

Definice: H₀ a H₁ tvoří vzájemně se doplňující dvojici hypotéz; testy jsou navrženy tak, aby posoudily konzistenci dat s H₀.

Testová statistika

Testová statistika je číslo vypočtené z dat, které měří „extrémnost" vůči H₀.
Čím větší odchylka testové statistiky od očekávané hodnoty za H₀, tím menší je podpora pro H₀.

Definice: Testová statistika shrnuje data do jediné hodnoty, podle níž rozhodujeme o zamítnutí nebo nezamítnutí H₀.

Chyby rozhodnutí

Tabulka chyb a správných rozhodnutí:

výsledek testu	skutečnost
H₀ nezamítáme	OK (1-α) nebo chyba typu II (β)
H₀ zamítáme	chyba typu I (α) nebo OK (1-β)

Chyba I. druhu (α): zamítnutí pravdivé H₀ (falešně pozitivní).
Chyba II. druhu (β): nezamítnutí nepravdivé H₀ (falečně negativní).
Síla testu (power) = $1-\beta$ je pravděpodobnost, že test správně zamítne H₀, když platí H₁.

Definice: Hladina významnosti $\alpha$ je přijímaná pravděpodobnost chyby I. druhu.

Interval spolehlivosti

Definice: Interval spolehlivosti (např. 95 %) je metoda, která konstruuje rozsah, z něhož přibližně daný podíl takto získaných intervalů z opakovaných vzorků bude obsahovat skutečnou hodnotu parametru.

Interpretace: 95% interval neříká, že existuje 95% šance, že parametr leží v tom konkrétním intervalu; říká, že postup pokrývá parametr v 95 % případů při opakování.

p-hodnota

p-hodnota je pravděpodobnost získat stejně extrémní nebo extrémnější data, pokud H₀ platí.
Pokud p-hodnota < $\alpha$, označujeme výsledek za statisticky významný a zamítáme H₀.

Definice: p-hodnota = $P(\text{data stejně extrémní nebo extrémnější} \mid H_0)$.

Věnujte pozornost tomu, čím p-hodnota NENÍ:

NENÍ pravděpodobnost, že H₀ je pravdivá.
NENÍ přímý důkaz praktické významnosti efektu.
NENÍ automatická „síla důkazu" vlineární škále; hodnoty blízko prahu jsou velmi podobné.

💡 Věděli jste?Fun fact: p-hodnota byla popularizována v souvislosti s prací Ronalda Fishera a úvahami o náhodnosti v experimentech.

Motivace a jednoduché příklady

Mince (motivace)

Cíl: rozhodnout, zda je mince férová na základě počtu padnutí panna/orl.
Přístup: porovnat pozorovaný počet s tím, co očekáváme pro férovou minci.

Příklad: 100 hodů, pozorujeme 77 panna a 23 orel. Jak rozhodnout, zda mince není férová?

Postup (srozumitelně): formulovat H₀ (mince férová), zvolit statistiku (např. podíl pann), spočítat pravděpodobnost pozorování tak extrémního výsledku za H₀ (p-hodnota), porovnat s $\alpha$.

Historie: Lady Tasting Tea

Fisher připravil 8 šálků, 4 s mlékem nalitým jako první a 4 s čajem jako první; dáma označila 4, které považovala za správné.
Počet kombinací je $\binom{8}{4} = 70$, pravděpodobnost náhodného přiřazení všech 4 správně je $1/70 \approx 0{,}014$.
Interpretace: tak nízká pravděpodobnost (p-hodnota) vede k zamítnutí H₀ a přijetí, že rozpoznávání může být reálné.

Postup při testování hypotéz (krok za krokem)

Formulace problému slovně.
Volba hladiny významnosti $\alpha$.
Výběr vhodného testu (dle typu dat a otázky).
Ověření předpokladů testu (např. nezávislost, rozložení).
Formulace H₀ a H₁ v matematické podobě.
Výpočet testové statistiky a p-hodnoty nebo konstrukce intervalu

Zaregistruj se pro celé shrnutí

KartičkyTest znalostíShrnutíPodcastMyšlenková mapa

Začni zdarma

Už máš účet? Přihlásit se

Testování hypotéz - přehled

Klíčová slova: Statistická analýza, Testování hypotéz, t-test

Klíčové pojmy: Formulujte H₀ a H₁ jasně a matematicky přesně, Testová statistika shrnuje data do jediné hodnoty pro rozhodnutí, p-hodnota = $P(\text{data stejně extrémní nebo extrémnější} \mid H_0)$, Chyba I. druhu je $\alpha$, chyba II. druhu je $\beta$, síla testu je $1-\beta$, Interval spolehlivosti popisuje proceduru pokrývání parametru, ne pravděpodobnost jedinečného intervalu, Reportujte test, popisné statistiky, testovou statistiku, interval, p-hodnotu a velikost účinku, Při mnohonásobném testování používejte korekce (FWER nebo FDR), Velikost účinku hodnotí praktickou významnost nezávisle na velikosti vzorku, Ověřujte předpoklady testu před aplikací, p-hodnota sama o sobě není důkazem praktické významnosti

## Úvod Testování hypotéz je sada principů a postupů, pomocí nichž posuzujeme, zda pozorovaná data podporují určité tvrzení o populaci (např. o parametru, vztahu mezi proměnnými nebo účinku zásahu). Cílem je učinit rozhodnutí na základě dat při zohlednění náhodné variability a nejistoty. > **Definice:** Test hypotéz je formální postup, který porovnává pozorovaná data s očekáváním plynoucím z nulové hypotézy H₀ za účelem rozhodnutí, zda H₀ zamítnout nebo ji nezamítnout. ## Základní pojmy ### Nulová a alternativní hypotéza - **H₀** (nulová hypotéza): obvykle tvrzení „bez efektu“ nebo „bez rozdílu“. Příklad: průměr populace se rovná určité hodnotě. - **H₁** (alternativní hypotéza): opak H₀, tj. existuje efekt nebo rozdíl. > **Definice:** H₀ a H₁ tvoří vzájemně se doplňující dvojici hypotéz; testy jsou navrženy tak, aby posoudily konzistenci dat s H₀. ### Testová statistika - Testová statistika je číslo vypočtené z dat, které měří „extrémnost" vůči H₀. - Čím větší odchylka testové statistiky od očekávané hodnoty za H₀, tím menší je podpora pro H₀. > **Definice:** Testová statistika shrnuje data do jediné hodnoty, podle níž rozhodujeme o zamítnutí nebo nezamítnutí H₀. ### Chyby rozhodnutí Tabulka chyb a správných rozhodnutí: | výsledek testu | skutečnost | | --- | --- | | H₀ nezamítáme | OK (1-α) nebo chyba typu II (β) | | H₀ zamítáme | chyba typu I (α) nebo OK (1-β) | - **Chyba I. druhu (α)**: zamítnutí pravdivé H₀ (falešně pozitivní). - **Chyba II. druhu (β)**: nezamítnutí nepravdivé H₀ (falečně negativní). - **Síla testu (power)** = $1-\beta$ je pravděpodobnost, že test správně zamítne H₀, když platí H₁. > **Definice:** Hladina významnosti $\alpha$ je přijímaná pravděpodobnost chyby I. druhu. ### Interval spolehlivosti > **Definice:** Interval spolehlivosti (např. 95 %) je metoda, která konstruuje rozsah, z něhož přibližně daný podíl takto získaných intervalů z opakovaných vzorků bude obsahovat skutečnou hodnotu parametru. - Interpretace: 95% interval neříká, že existuje 95% šance, že parametr leží v tom konkrétním intervalu; říká, že postup pokrývá parametr v 95 % případů při opakování. ### p-hodnota - p-hodnota je pravděpodobnost získat stejně extrémní nebo extrémnější data, pokud H₀ platí. - Pokud p-hodnota < $\alpha$, označujeme výsledek za statisticky významný a zamítáme H₀. > **Definice:** p-hodnota = $P(\text{data stejně extrémní nebo extrémnější} \mid H_0)$. Věnujte pozornost tomu, čím p-hodnota NENÍ: - NENÍ pravděpodobnost, že H₀ je pravdivá. - NENÍ přímý důkaz praktické významnosti efektu. - NENÍ automatická „síla důkazu" vlineární škále; hodnoty blízko prahu jsou velmi podobné. Fun fact: p-hodnota byla popularizována v souvislosti s prací Ronalda Fishera a úvahami o náhodnosti v experimentech. ## Motivace a jednoduché příklady ### Mince (motivace) - Cíl: rozhodnout, zda je mince férová na základě počtu padnutí panna/orl. - Přístup: porovnat pozorovaný počet s tím, co očekáváme pro férovou minci. Příklad: 100 hodů, pozorujeme 77 panna a 23 orel. Jak rozhodnout, zda mince není férová? > **Postup (srozumitelně):** formulovat H₀ (mince férová), zvolit statistiku (např. podíl pann), spočítat pravděpodobnost pozorování tak extrémního výsledku za H₀ (p-hodnota), porovnat s $\alpha$. ### Historie: Lady Tasting Tea - Fisher připravil 8 šálků, 4 s mlékem nalitým jako první a 4 s čajem jako první; dáma označila 4, které považovala za správné. - Počet kombinací je $\binom{8}{4} = 70$, pravděpodobnost náhodného přiřazení všech 4 správně je $1/70 \approx 0{,}014$. - Interpretace: tak nízká pravděpodobnost (p-hodnota) vede k zamítnutí H₀ a přijetí, že rozpoznávání může být reálné. ## Postup při testování hypotéz (krok za krokem) 1. Formulace problému slovně. 2. Volba hladiny významnosti $\alpha$. 3. Výběr vhodného testu (dle typu dat a otázky). 4. Ověření předpokladů testu (např. nezávislost, rozložení). 5. Formulace H₀ a H₁ v matematické podobě. 6. Výpočet testové statistiky a p-hodnoty nebo konstrukce intervalu