Korelačná analýza a jej koeficienty: Sprievodca pre študentov
Koeficienty korelácie sú štatistické miery, ktoré kvantifikujú silu a smer vzťahu medzi dvoma premennými. Tento materiál vysvetľuje najpoužívanejšie koeficienty korelácie, kedy ich použiť, ako ich interpretovať a ako ich vypočítať alebo získať v SPSS.
Definícia: Koeficient korelácie je číselná hodnota, ktorá udáva smer (kladný alebo záporný) a silu vzťahu medzi dvoma premennými.
Nižšie sú hlavné typy koeficientov, ktoré budeme preberať:
| Koeficient | Miera | Typ premenných | Poznámka |
|---|---|---|---|
| Pearsonov r | Lineárna korelácia | Intervalová/početná, normálne rozdelené | Citlivý na odľahlé hodnoty a predpoklad linearity |
| Spearmanov ρ | Monotónna korelácia | Ordinálna alebo intervalová bez normálnosti | Neparametrický, odolný voči odľahlým hodnotám |
| Kendallovo τ | Súhlas/nesúhlas v poradí | Ordinálna | Alternatíva k Spearmanovi, použitie tau-b/tau-c |
| Phi (φ) | Asociácia v 2×2 tabuľke | Nominálna (dichotomická) | Základ na χ^2 pre 2×2 |
| Cramerovo V | Asociácia pre väčšie tabuľky | Nominálna s >2 kategóriami | Normalizované z χ^2 podľa min(r-1,c-1) |
Definícia: Pearsonov koeficient korelácie $r$ meria silu a smer lineárneho vzťahu medzi dvoma premennými a nadobúda hodnoty od $-1$ po $+1$.
Analyze – Correlate – Bivariate
Definícia: Spearmanov koeficient ρ je neparametrická miera monotónneho vzťahu medzi dvoma premennými, nadobúda hodnoty od $-1$ do $+1$.
Pre počet $n$ pozorovaní a poradové stupne $P_{x,i}$ a $P_{y,i}$ platí:
$$\rho_S = 1 - \dfrac{6}{n(n^2-1)}\sum_{i=1}^{n}\left(P_{x,i} - P_{y,i}\right)^2$$
Analyze – Correlate – Bivariate
Definícia: Kendallovo tau meria priemernú mieru súhlasu v poradí hodnôt dvoch premenných podľa princípu zhody a nezhody párov pozorovaní.
Analyze – Descriptive Statistics – Crosstabs – Statistics – zvoliť Kendall's tau
Definícia: Phi ($\varphi$) je miera sily asociácie pre 2×2 kontingenčné tabuľky, odvodená z testu chí-kvadrát.
$$\varphi = \sqrt{\dfrac{\chi^2}{n}}$$
kde $\chi^2$ je štatistika chí-kvadrát a $n$ je veľkosť vzorky.
Už máš účet? Prihlásiť sa
Klíčová slova: Korelačná analýza, Koeficienty korelácie
Klíčové pojmy: Pearson meria lineárnu koreláciu pre intervalové/pomerové dáta s normalitou, Pri výbere testať jednostranný test len pre smerovú hypotézu, inak obojstranný, Spearmanov ρ je neparametrický a meria monotónnosť pre ordinálne alebo nenormálne intervalové dáta, Vzorec Spearmana: $$\rho_S = 1 - \dfrac{6}{n(n^2-1)}\sum_{i=1}^{n}\left(P_{x,i} - P_{y,i}\right)^2$$, Kendallovo τ meria súlad/nezhodu párov podľa poradia, používajte tau-b alebo tau-c podľa typu tabuľky, Phi: $$\varphi = \sqrt{\dfrac{\chi^2}{n}}$$ pre 2×2 nominálne tabuľky, Cramerovo V: $$V = \sqrt{\dfrac{\chi^2}{n\min(c-1,\;r-1)}}$$ pre väčšie nominálne tabuľky, Pre 2×2 tabuľku je Cramerovo V rovnaké ako Phi, SPSS: Analyze – Correlate – Bivariate pre Pearson/Spearman; Crosstabs pre Kendall/Phi/Cramer, Spearman a Kendall sú odolné voči odľahlým hodnotám a nevyžadujú normalitu