Análisis de las mortalidad e incidencia del cáncer por entidades federales en Venezuela
(2014-2021)
(2014-2021)
Para una mejor experiencia, visualiza este dashboard en una computadora. Si lo ves desde tu celular, te recomiendo cambiar a modo horizontal.
Este es un proyecto que decidí realizar luego de culminar una Career Track de Datacamp en “Data Analyst in SQL” y un “Curso Profesional de Base de Datos” realizado en códigofacilito. La información para el proyecto se encuentra en la página web www.cancerenvenezuela.org, allí podemos encontrar en la pestaña de publicaciones como “Pronósticos de la mortalidad e incidencia de cáncer en Venezuela, año 2021”, esto es un archivo que se descargará en PDF, en el cual encontraremos los datos recopilados del cáncer en Venezuela y se dividen por dependencias federales (los 23 estados) y por grupos etarios.
En este proyecto tome como datos el estudio hecho para 3 tipos de cáncer como lo fueron el de mama, próstata y pulmón (hombres y mujeres) para los 23 estados del país, en este documento podemos observar tablas con datos que van desde el año 2014 al 2021. Debido a lo tedioso que suele ser verificar cualquier información que se desee buscar en este PDF de más de 300 páginas, fue que me nació la idea de poder realizar un dashboard en el cual pudiera acceder a cualquier información que desee encontrar. Por ejemplo, en el PDF para buscar la información del cáncer de próstata para el estado Táchira del año 2016 página 309, y luego se quiere buscar información de la cantidad de mortalidad para el estado Anzoátegui con respecto al cáncer de pulmón en mujeres para el año 2020 hay que retroceder a la posición 239.
Toda esta información se pasó de PDF a Excel utilizando Jupyter Notebook, mediante la cual se usaron diversas librerías de Python como Numpy, tabula y pandas para extraer solo la información de interés de los cuadros de datos del PDF. Seguidamente esta información de las tablas las pasamos a SQL, en donde decidí realizar una base de datos con 3 tablas diferentes, una con los tipos de cáncer, otro con los años de los datos, y un último con los datos de los estados, mortalidad, incidencia, y las tasas tanto de mortalidad como de incidencia, con estas tres tablas se trabajó en Power BI gracias a la correcta relación que pude realizar entre ellas.
Ya en Power BI la distribución fue la siguiente:
En la parte superior izquierda el título del proyecto “Estimaciones de la mortalidad e incidencia del cáncer por entidades federales en Venezuela” Sociedad Anticancerosa de Venezuela (SAV) – Periodos (2014-2021).
En la parte superior derecha una botonera con todos los años de los datos, que van desde el 2014 al 2021, con opción a elegir uno solo.
Un gráfico de barras horizontales en la parte izquierda, en donde nos muestra la información de la cantidad de Mortalidad (en barras rojas) y la Incidencia (en barras azules), ordenados de forma descendiente, del estado con mayor cantidad de mortalidad al estado con menor cantidad, al poner el clic encima nos muestra la información de la cantidad total ya sea de mortalidad o incidencia, y el porcentaje del total de mortalidad e incidencia.
En la parte inferior central dos cuadros con 2 gráficos circulares, uno con la información de la mortalidad (en rojo) y el otro con la información de la incidencia (en azul). De no seleccionar ningún estado nos mostrará la cantidad total de cada uno dependiendo del año que se tiene seleccionado.
En la parte derecha tenemos dos recuadros, uno con la información de los 3 tipos de cáncer (mama, próstata y pulmón tanto para hombres como para mujeres) en donde se puede seleccionar solo uno y esto modificará lo que se mostrará en todos los demás renglones. Debajo de este recuadro está un tipo menú desplegable con el nombre de todos los estados de Venezuela, para seleccionar el que se desea consultar.
En la parte central del Dashboard está un mapa de Venezuela, este mapa no está entre los predeterminados de Power BI, por lo que me toco realizarlo a través de la página geojson.io y trazar estado por estado hasta completar todo el mapa, esta información queda registrada en latitudes y longitudes, una vez culminado el mapa (un trabajo tedioso) lo cambie de formato a JSON con mapshaper formato que si acepta Power BI, una vez cargado el mapa las condiciones puestas para el mismo fueron, mientras el estado tenga mayor cantidad de mortalidad se verá en rojo, en donde el color va a ir cambiando (degradándose) de rojo (mayor cantidad) a azul una cantidad media y los estados con menor cantidad de mortalidad se verán en amarillo.
Al poner el click encima de cualquier estado se mostrará una tarjeta (tooltips) con el nombre del estado en donde está el click y una gráfica de la mortalidad e incidencia vs los años, donde podemos ver si las cifras han ido en aumento o en disminución.
Al seleccionar un estado del recuadro de estados, en el mapa se hará un zoom de manera automática hacia el estado seleccionado, mostrando su color dependiendo de la mortalidad que tenga, y en los gráficos circulares se mostrará la información con respecto a ese estado, al tipo del cáncer y al año seleccionado.
El gráfico de barras horizontal solo cambiará su información cuando se cambie el año y el tipo de cáncer.
Por último, en la parte inferior puse mi nombre, seguidamente del link de donde extraje la información de los datos. www.cancerenvenezuela.org/descargas/Pronosticos-de-la-mortalidad-e-incidencia-de-cancer-2021.pdf