Data Governance
Arquitectura en capas ODS → DW → DM con DWS, DLI Spark y Langfuse.
📐 Arquitectura de Referencia — Datos en vivo en DWS Console y LangfuseArquitectura en Capas — ODS → DW → DM
OBS Storage
Datos crudos
DataArts ETL
Limpieza y transformación
DWS Target
Tablas curadas
DataService API
REST endpoints
Etapas del Pipeline
Extract
CompletadoLectura de datos crudos desde OBS (CSV, JSON, PDFs)
Transform
CompletadoLimpieza, normalización CNBV, deduplicación
Validate
CompletadoReglas de calidad: nulos, rangos, consistencia
Load
CompletadoEscritura a DWS con particionamiento por fecha
Publish
ActivoDataService API REST con cache y rate limiting
DWS — Arquitectura en Capas
Los datos 'maduran' de crudos (ODS) a analíticos (DM). Cada capa agrega validación y transformación.
ODS — Datos Crudos
Ingesta directa desde fuentes. Sin transformación. Auditoría de origen.
DW — Esquema Estrella
Limpieza, deduplicación, normalización. Dimensiones + hechos.
DM — Vistas Analíticas
Agregaciones pre-calculadas para dashboards y reportes ejecutivos.
Streamlit con queries en vivo a DWS — Data Quality + Governance tabs
Métricas de Calidad de Datos
Valores de referencia — Métricas reales en DWS SQL Editor (Paso 2 del demo)
Completitud
98.7%
Campos no nulos vs total
Consistencia
99.2%
Reglas de negocio válidas
Freshness
<5min
Latencia de datos actualizados