Zhluková Analýza pre Marketing: SEO Sprievodca pre Študentov
Ťukni na otočenie · Potiahni na navigáciu
105 kartičiek
Otázka: Aké sú základné typy dát používané v zhlukovej analýze?
Odpoveď: Metrické (intervalové, pomerové), nominálne, ordinálne, binárne.
Otázka: Prečo je dôležité správne identifikovať typ dát pred zhlukovaním?
Odpoveď: Výber metódy závisí od typu dát; ovplyvňuje výber miery vzdialenosti a algoritmu zhlukovania.
Otázka: Ako sa definuje euklidovská vzdialenosť a k čomu sa používa?
Odpoveď: D = √(Σ(xi - yi)²); najpoužívanejšia pre numerické dáta.
Otázka: Čo je Manhattan (taxicab) vzdialenosť a aká je jej výhoda?
Odpoveď: D = Σ|xi - yi|; robustnejšia, menej citlivá na extrémy.
Otázka: Čo zohľadňuje Mahalanobisova vzdialenosť?
Odpoveď: Koreláciu medzi premennými.
Otázka: Prečo treba normalizovať dáta pred výpočtom vzdialeností?
Odpoveď: Premenné majú rôzne rozsahy, čo môže deformovať výsledky; niektoré premenné by inak dominovali.
Otázka: Aké sú výhody normalizácie?
Odpoveď: Rovnaký vplyv všetkých premenných, presnejšie výpočty vzdialenosti, lepšia konvergencia algoritmov.
Otázka: Ako funguje Z-score štandardizácia?
Odpoveď: z = (x - μ) / σ; prevedie dáta na priemer 0 a štandardnú odchýlku 1; vhodné pri normálnom rozdelení.
Otázka: Ako funguje min-max normalizácia a kedy je vhodná?
Odpoveď: x' = (x - min) / (max - min); škáluje do [0,1]; vhodná ak sú jasné hranice.
Otázka: Ktorá normalizácia je obzvlášť dôležitá pre metrické vzdialenosti a algoritmus K-means?
Odpoveď: Normalizácia (Z-score alebo min-max) je kritická pre K-means.