Fundamentos de Data Warehousing y GIS: Guía Completa para Estudiantes
El almacenamiento de datos (Data Warehouse) es una estructura diseñada para reunir, integrar y conservar datos históricos de una organización con el fin de apoyar la toma de decisiones. Aunque hay varios enfoques y arquitecturas, su propósito central es ofrecer una visión consistente, confiable y orientada a temas que facilite el análisis y la generación de informes.
Definición (Bill Inmon): Una colección de datos orientados a temas, integrados, variables en el tiempo y no volátiles para ayudar al proceso de toma de decisiones en una organización.
Definición: Orientado a temas: organización de datos por dominios relevantes para la gestión, en lugar de por procesos operativos.
Definición: Integrado: datos combinados y armonizados desde múltiples sistemas para eliminar ambigüedades.
Definición: Variable con el tiempo: conservación de versiones y registros históricos para permitir análisis a lo largo del tiempo.
Definición: No volátil: los datos almacenados no se alteran por usuarios operativos y solo se actualizan mediante procesos formales.
Definición: Data Mart: subconjunto de datos orientado a un área o propósito específico dentro de la empresa.
| Característica | Data Warehouse (EDW) | Data Mart |
|---|---|---|
| Alcance | Corporativo | Departamental |
| Visión | Integrada y global | Parcial, focalizada |
| Temas | Muchas áreas temáticas | Pocas o una temática |
| Fuentes | Muchas fuentes de datos | Pocas fuentes |
| Detalle e historia | Detallado e histórico | Detallado con algo de historia o resumido |
| Implementación típica | 9 – 18 meses | 4 – 12 meses |
| Enfoque | Estratégico, duradero | Táctico, de vida más corta |
Definición: Metadatos: datos que describen otros datos, incluyendo su origen, significado y reglas de uso.
¿Ya tienes cuenta? Iniciar sesión
Klíčová slova: Almacenamiento de datos (Data Warehouse), Almacenamiento de datos y ETL, Sistemas de Información Geográfica
Klíčové pojmy: Definición de Data Warehouse según Inmon, Datos orientados a temas facilitan análisis por dominio, Integración: homogeneizar formatos y claves para consistencia, El DW guarda datos históricos; el tiempo es una dimensión clave, No volátil: solo procesos controlados pueden modificar datos, EDW es corporativo y de amplio alcance; Data Mart es departamental, Inmon (top-down) vs Kimball (bottom-up) en enfoque arquitectónico, Metadatos describen origen, transformaciones y significado de datos, Star schema facilita consultas analíticas con tabla de hechos y dimensiones, Diseño dimensional puede reducir tiempos de consulta, Buenas prácticas: gobernanza y calidad de datos, Migración a la nube permite escalabilidad y flexibilidad