Mery asociácie kategórií
Klíčová slova: Štatistické testy porovnania skupín, Závislé štatistické testy a miery asociácie, Mery asociácie pre kategórie
Klíčové pojmy: Mery volíme podľa typu premenných: nominálne vs ordinálne, Phi pre 2×2 nominálne tabuľky, Cramerovo V pre väčšie nominálne tabuľky, Lambda meria zlepšenie predikcie (asymetrická), Gamma ($\gamma$) pre ordinálne, ignoruje viazané poradia, Kendall tau‑b zohľadňuje viazané poradia, Kendall tau‑c pre nerovné rozmery tabuľky, Somersovo d je asymetrická ordinálna miera (prediktor→výsledok), Hodnota blízka 0 = slabá asociácia, znamienko udáva smer, Pri interpretácii kombinujte efekt s praktickým významom, Postup výberu: typ premenných → rozmer tabuľky → účel merania, Vizualizujte tabuľky pri interpretácii
## Úvod
Mery asociácie pre kategórie sú štatistické nástroje na popis sily a smeru vzťahu medzi kategorizovanými premennými. Pomáhajú odpovedať na otázky ako: majú dve premenné medzi sebou vzťah? Aký je jeho smer? Ako silný je? Tento materiál zhrnie najčastejšie miery pre nominálne a ordinálne premenné, vysvetlí kedy ich použiť a ukáže praktické príklady.
> **Definícia:** Mera asociácie je štatistická veličina, ktorá kvantifikuje vzťah medzi dvoma kategorizovanými premennými, pričom rôzne miery zohľadňujú rôzne typy premenných a viazané poradia.
## Základné rozdelenie podľa typu premenných
- **Nominálne premenné** (bez poradia) — použijeme miery ako Phi, Cramerovo V, Lambda.
- **Ordinálne premenné** (s poriadkom) — vhodné sú Gamma, Kendall tau‑b, tau‑c, Somersovo d.
### Rýchly ťahák
- nominálne + 2×2 → Phi
- nominálne + väčšia tabuľka → Cramerovo V
- predikcia kategórií → Lambda (zlepšenie predikcie)
- ordinálne → Gamma, Kendall, Somers
## Prehľad hlavných mier (jednovetové definície)
> **Cramerovo V:** Vyjadruje silu asociácie medzi nominálnymi premennými.
> **Lambda:** Vyjadruje zlepšenie predikcie jednej premennej pomocou druhej.
> **Gamma:** Meria silu a smer asociácie medzi ordinálnymi premennými.
> **Somersovo d:** Asymetrická miera asociácie pre ordinálne premenné, rozlišuje závislú a nezávislú premennú.
## Podrobnejšie vysvetlenie mier
### Phi koeficient
- Použitie: iba pre 2×2 kontingenčné tabuľky.
- Hodnoty: medzi $-1$ a $+1$ ($-1$ = silná negatívna asociácia, $0$ = žiadna asociácia, $+1$ = silná pozitívna asociácia).
- Praktický príklad: test pozitívny/negatívny a prítomnosť symptómu áno/nie.
### Cramerovo V
- Použitie: nominálne premenné v ľubovoľnom $r \times c$ rozmere.
- Hodnoty: od $0$ do $1$; 0 = žiadna asociácia, 1 = perfektná asociácia.
- Poznámka: normalizuje chí‑kvadrát podľa menšieho rozmeru tabuľky.
### Lambda (asymetrická neistota / zlepšenie predikcie)
- Použitie: keď nás zaujíma, do akej miery znalosť jednej premennej zlepšuje predikciu druhej.
- Hodnoty: medzi $0$ a $1$; 0 = žiadne zlepšenie, 1 = dokonalé zlepšenie.
- Praktické využitie: modelovanie kategórií v sociálnych štúdiách, kde chceme merať prínos prediktora.
### Goodman–Kruskalova gamma ($\gamma$)
- Použitie: ordinálne premenné, ignoruje viazané poradia.
- Hodnoty: medzi $-1$ a $+1$.
- Poznámka: vhodná, keď je málo rovnakých hodnôt.
- Príklad: porovnanie poradia preferencií dvoch produktov.
### Kendallovo tau‑b
- Použitie: párované poradia, tabuľky môžu byť $2 \times 2$ alebo väčšie.
- Berie do úvahy viazané poradia.
- Hodnoty medzi $-1$ a $+1$.
### Kendallovo tau‑c
- Použitie: keď tabuľka nie je štvorcová, premenné majú rôzny počet kategórií.
- Úprava tau pre nerovnomerné rozmery tabuľky.
### Somersovo d
- Použitie: rozlišuje závislú a nezávislú premennú (asymetrická miera).
- Veľmi časté v sociálnych a behaviorálnych vedách pri hodnotení prediktívnej sily ordinálneho ukazovateľa.
- Hodnoty medzi $-1$ a $+1$; znamienko udáva smer asociácie.
## Porovnanie mier (tabuľka)
| Miera | Typ premenných | Zohľadňuje viazané poradia | Asymetrická | Rozsah hodnôt |
|---|---:|:---:|:---:|:---:|
| Phi | nominálne, 2×2 | nie | nie | $-1$ až $+1$ |
| Cramerovo V | nominálne, $r\times c$ | nie | nie | $0$ až $1$ |
| Lambda | nominálne | nie | áno (zlepšenie predikcie) | $0$ až $1$ |
| Gamma ($\gamma$) | ordinálne | nie (ignoruje viazané) | nie | $-1$ až $+1$ |
| Kendall tau‑b | ordinálne | áno | nie | $-1$ až $+1$ |
| Kendall tau‑c | ordinálne | čiastočne (pre nerovné rozmery) | nie | $-1$ až $+1$ |
| Somersovo d | ordinálne (asym.) | áno | áno | $-1$ až $+1$ |
## Praktické príklady
1. Firma skúma spojitosť medzi pohlavím (M/F) a voľbou produktu (A/B). Tabuľka 2×2 → použijeme **Phi**.
2. Prieskum kvality služieb s kategóriami {veľmi zlé, zlé, priemerné, dobré, výborné} vs regióny (5 regiónov). Obidve premenné sú ordinálne/nominálne → ak chceme poradie použijeme **Gamma** alebo **Kendall**, ak len silu pre nominálnu premennú použijeme **Crame