Základy dat, informací a jejich kvalita: Komplexní průvodce
Kvalita dat a správa dat (Data Governance) jsou klíčové oblasti pro každou organizaci, která chce bezpečně a efektivně využívat data pro rozhodování. Tento studijní materiál vysvětluje rozdíly mezi daty, informacemi, znalostmi a moudrostí, popisuje vlastnosti kvalitních dat, kroky řízení dat a praktické postupy čištění a kontroly kvality.
Data: Samotné údaje, měřené nebo zaznamenané hodnoty bez interpretace.
Informace: Data interpretovaná tak, aby dávala smysl.
Znalost: Informace doplněná o zkušenosti a pochopení.
Moudrost: Schopnost správně využít znalosti pro rozhodnutí.
Data → Informace → Znalosti → Moudrost
Kvalitní data jsou taková, která jsou vhodná pro rozhodování a použití.
| Vlastnost | Co znamená | Příklad problému při nedodržení |
|---|---|---|
| Úplnost | Nic nechybí | Chybějící kontaktní údaje u zákazníků |
| Přesnost | Data odpovídají skutečnosti | Nesprávná výška budovy |
| Konzistence | Data si nejsou v rozporu | Různé kódy pro stejný produkt |
| Aktuálnost | Data jsou současná | Zastaralé ceny v e-shopu |
| Dostupnost | Data jsou přístupná | Nefunkční datové úložiště |
| Platnost | Data odpovídají pravidlům | Nesprávný formát rodného čísla |
| Integrita | Zachovány vztahy mezi daty | Chybějící vazby mezi tabulkami |
| Unikátnost | Neobsahují duplicity | Duplicitní záznamy zákazníků |
Poznámka: V praxi se tyto vlastnosti často překrývají a zlepšení jedné může ovlivnit ostatní.
Systém pravidel a postupů pro správu dat v organizaci. Obsahuje následující kroky:
Proces hledání a opravování chyb v datech. Zahrnuje:
Praktický příklad: při importu zákaznické databáze z více zdrojů provést deduplikaci na základě e‑mailu a sjednotit formát telefonních čísel.
Kontroluje, zda jsou data použitelná pro daný účel. Pokud data obsahují příliš mnoho chyb, nesmí se používat, aby se zabránilo chybným rozhodnutím.
Příklad rizika: Špatná data ze senzorů letadla mohou způsobit nesprávná rozhodnutí a vést k nehodě.
Už máš účet? Přihlásit se
Klíčová slova: Kvalita dat a správa dat
Klíčové pojmy: Data jsou surové hodnoty, informace vznikají interpretací dat, Data → Informace → Znalosti → Moudrost pro lepší rozhodování, Vlastnosti kvalitních dat: úplnost, přesnost, konzistence, aktuálnost, Další vlastnosti: dostupnost, platnost, integrita, unikátnost, Data Governance zahrnuje profilování, standardizaci, statistiku, monitorování, pravidla, Čištění dat: oprava překlepů, odstranění duplicit, doplnění chybějících údajů, Kontrola kvality zabraňuje použití chybných dat a špatným rozhodnutím, Při migraci dat hrozí duplicity a ztráty; zajistěte referenční a entitní integritu, Tvrdá data jsou měřitelná, měkká data jsou názory a postoje, Implementujte automatické kontroly při zápisu a pravidelnou deduplikaci, Měřte metriky kvality (např. % úplnosti) a pravidelně je monitorujte, Stanovte odpovědnosti za kvalitu dat v rámci organizace