Lago de Datos
by Johan Manuel Redondo PhD.
Lago de Datos
by Johan Manuel Redondo PhD.
En muchas entidades públicas y privadas, la información existe pero no está integrada ni ordenada. Existen múltiples bases de datos, expedientes físicos y digitales, archivos multimedia y otras fuentes dispersas que se gestionan de forma fragmentada. Esta situación limita el análisis profundo, dificulta la interoperabilidad y retrasa la toma de decisiones estratégicas. Para resolverlo, se propone la construcción de un lago de datos como arquitectura base para consolidar, transformar y aprovechar la información, no solo de la entidad, sino de todo su ecosistema ampliado: actores territoriales, institucionales, aliados estratégicos y redes de trabajo colaborativo.
La estrategia comienza con la identificación y organización de fuentes de datos, que se agrupan en tres grandes categorías:
1. Bases estructuradas o semiestructuradas, como hojas de cálculo, formularios digitales o registros administrativos.
2. Expedientes físicos y digitales, como informes, resoluciones, actas, documentos escaneados y PDFs.
3. Contenidos multimedia y digitales no estructurados, como imágenes, audios, videos, publicaciones en redes sociales y páginas web.
Toda esta información se consolida inicialmente en la zona de ingreso del lago, denominada Landing. Allí se almacenan los datos tal como llegan, sin transformarlos, garantizando trazabilidad, procedencia y control documental. Luego, mediante procesos de extracción, transformación y carga (ETL), la información se va refinando a lo largo de tres capas sucesivas:
• En la capa de Bronce, los datos mantienen su forma original pero se les adicionan metadatos que permiten su clasificación y posterior procesamiento.
• En la capa de Plata, los datos ya han sido depurados, estandarizados y organizados para poder integrarse entre diferentes fuentes.
• En la capa de Oro, los datos se encuentran listos para análisis profundos, en modelos estructurados, normalizados y con un alto valor agregado.
Desde la capa de Oro, los datos fluyen hacia el módulo de analítica, donde adquieren sentido y se convierten en insumo para la generación de conocimiento y decisiones estratégicas. Este módulo se organiza en seis grandes categorías, cada una vinculada a una pregunta orientadora que guía su propósito:
1. Analítica descriptiva – ¿Qué pasó? Resume y visualiza hechos ocurridos en el pasado. Permite identificar tendencias históricas, evaluar el cumplimiento de metas y reconstruir contextos mediante datos históricos. Se apoya en reportes, series de tiempo, comparativos y líneas base.
2. Analítica de monitoreo – ¿Qué está pasando? Permite observar fenómenos en tiempo real o con poca latencia. Se utiliza para sistemas de seguimiento, alertas tempranas, trazabilidad de procesos y control operativo. Se basa en flujos de datos vivos que se visualizan mediante dashboards actualizados.
3. Analítica geoespacial – ¿Dónde pasó? ¿Dónde está pasando? Incorpora el componente territorial en el análisis, permitiendo visualizar patrones por zonas, regiones o puntos geográficos específicos. Es clave para planificar, focalizar intervenciones, detectar zonas críticas o evaluar impactos diferenciales.
4. Analítica explicativa – ¿Por qué pasó? Busca comprender relaciones causales, correlaciones o dependencias entre variables. Responde a necesidades de evaluación de políticas, identificación de factores de riesgo, análisis institucional o diagnóstico de problemas estructurales.
5. Analítica predictiva – ¿Qué pasará? Utiliza modelos matemáticos, estadísticos o de inteligencia artificial para anticipar el comportamiento futuro de variables clave. Permite evaluar riesgos, planificar escenarios y tomar decisiones con base en proyecciones informadas.
6. Analítica prescriptiva – ¿Qué pasaría si…? Explora diferentes escenarios simulados para sugerir cursos de acción. Es útil para modelar decisiones estratégicas bajo incertidumbre, evaluar políticas alternativas o diseñar estrategias robustas en contextos complejos y cambiantes.
Este conjunto de análisis genera productos como tableros, informes ejecutivos, alertas inteligentes, modelos territoriales, simulaciones o reportes técnicos. Sin embargo, su mayor valor no está en el producto en sí, sino en su capacidad de retroalimentar el sistema institucional y su ecosistema. La información procesada se convierte en conocimiento organizacional, que orienta decisiones en todos los niveles: desde la operación diaria hasta la planificación estratégica de largo plazo.
Este conocimiento también puede fluir hacia actores del ecosistema (otros niveles de gobierno, organizaciones sociales, ciudadanía, aliados territoriales), fortaleciendo la inteligencia colectiva y permitiendo una gestión colaborativa basada en evidencia.
Así, el lago de datos no es solo una infraestructura técnica, sino una estrategia de transformación organizacional. Permite pasar del caos informativo a la acción informada; del dato disperso al conocimiento integrado; y de decisiones reactivas a decisiones anticipatorias, coordinadas y sostenibles.