Para tener una mejor experiencia se recomienda visualizar los tableros en una pantalla de computadora (PC o Laptop). En caso de visualizarlo desde el celular, se recomienda cambiar a una vista apaisada del móvil.
Este dashboard es el resultado de un proyecto que fue presentado para competir en el Concurso Nacional de Visualización de Datos 2024 organizado por la Universidad del San Andrés de Argentina (UdeSA).
El proyecto tiene como propósito brindar información que permita realizar un análisis de la actividad de hidrocarburos en Argentina, vinculando datos relacionados con la producción y reservas de petróleo y gas, las inversiones realizadas por las empresas operadoras de las concesiones y las actividades de fractura que demanda este tipo de explotación.
El origen de los datos provienen de reportes publicados periódicamente por la Secretaría de Energía de Argentina.
El proyecto, además de trabajar en lo visualización de datos, presenta desafíos en la extracción, transformación e integración de los datos, cómo así también en el modelado y creación de métricas específicas de la industria.
A continuación te presento el dashboard en Power BI, y luego de este podrás encontrar algunas imágenes que permiten explorar más sobre las tareas de ETL usando Power BI Dataflows, el modelo dimensional de datos, y algunas de las medidas creadas con DAX.
Aqui se puede ver parte del trabajo de ETL con Power BI Dataflows. Para llevar adelante la tarea se planificó una arquitectura en 3 capas al estilo medallón, siendo la capa 1 (C1) la que se corresponde a la extracción de datos crudos (raw) desde el origen; la capa 2 (C2) se alimenta de la C1 y corresponde a combinaciones o joins entre datos del mismo origen (ejemplo, consolidar datos anuales o mensuales en una misma consulta); y por último la capa 3 (C3) que se alimenta de la C2 y es donde se realizan algunas transformaciones más específicas y donde se asignan las keys (o ids) para las relaciones entre tablas de hechos y dimensiones en el modelo de datos.
Cada capa cuenta con múltiples dataflows debido a que el modelo se alimenta con datos que representan múltiples hechos.
El modelo de datos resultante se compone de múltiples tablas de hechos., siguiendo las premisas de un modelo de datos dimensional. La vista inicial del modelo presenta una gran cantidad de tablas. Para una mejor organización y comprensión cree vistas individuales (layouts) que permitan visualizar la relación entre cada tabla de hecho y las tablas de dimensiones respectivas.
A su vez, se definieron los campos claves en cada tabla, y se administra la visibilidad de las columnas key que no necesitan ser visibles en los datos para crear informes.
Para poder lograr reflejar buenos insights a partir de los datos modelados, escribí varias medidas con DAX representativas de esta industria. Todas las medidas se encuentran alojadas en una tabla de medidas y separadas en carpetas según su propósito. Esta buena práctica permite una mejor comprensión y administración.
A su vez, he usado grupos de cálculo para agregar dinamismo a las visualizaciones, de modo que se puedan reciclar y reusar algunos cálculos comunes como suelen ser los de inteligencia temporal.
Para dar una mayor usabilidad al dashboard inserté algunos parámetros de campo que permiten intercambiar fácilmente atributos o medidas en las visualizaciones.
Al momento de asignar nombres a las medidas trato siempre de usar una nomenclatura que me permite identificarlas adecuadamente, lo cual facilita la documentación y administración de mi diccionario de datos. En la creación de las medidas en DAX uso variables, aplico un formato adecuado al código y de ser necesario me apoyo en la herramienta DAX Studio para explorar mi modelo de datos y optimizar medidas.