Covid, de donde venimos y adonde vamos

Lucas Prone

Descripción

El objetivo del proyecto es analizar a partir de datos de fuentes oficiales y confiables la evolución de casos de coronavirus a nivel nacional, regional y mundial. Se propondrá un análisis comparativo entre diferentes países con accionar diferente y sus resultados, como así también eventos puntuales en el país y su efecto en la cantidad de casos.

Problemas interesantes a analizar son presencia de fuentes de datos poco confiables como así también países donde la cantidad de casos puede sospecharse manipulada.

A nivel técnico el desafío será adaptar los datos provistos a una estructura amigable para su análisis como así también obtener datos externos para ampliar el análisis.

Se espera obtener conclusiones a partir de los datos analizados que puedan ser fundamentadas estadísticamente y presentadas de manera clara y entendible para el público en general

Este tema es interesante porque:

Este tema resulta de interés por ser un tema de actualidad y gran impacto en la sociedad, con mucha información para analizar, y además por la posibilidad de tener un análisis correcto de esta información, ya que abundan sobre el tema análisis incorrectos o tendenciosos.

Trataremos de responder algunas de las siguientes preguntas:

¿Cuales son las diferentes etapas de la pandemia que cursan los diferentes países?

¿En qué etapa está nuestro país en este momento?

¿Cómo podrían avanzar las cifras en nuestro país?

¿Cómo impactan las diferentes eventos sobre las curvas?

¿Cómo analiza la situación de nuestro país comparado con otros países de la región? Y del mundo?

¿Hay países cuyas cifras resultan sospechosas?

¿Se logró “aplanar la curva”?

¿Se alcanzó un pico? En qué punto y cuál fue su valor?

¿Que nuevas métricas podrían ayudar a entender mejor el problema?

¿Qué métricas comparten los países que mejor controlaron el problema?

¿Hay características comunes entre los países con mejores/peores resultados?

¿Que gráficos y valores resultan apropiados para describir y comunicar información y cuáles no?

Los datos

Si querés inspeccionar el conjunto de datos, lo encontrarás en:

Hitos de la mentoría

22/6 práctico de análisis y visualización, que consistirá en:

Analizar calidad de los datos, calcular estadísticos, graficar cantidad total de casos por país utilizando información geográfica.

Se deberá analizar y graficar información de varios países considerando tipos de gráfico y escalas convenientes en cada caso.

Se deberá generar gráficos de correlación y concluir al respecto.

19/7 práctico de análisis y visualización, que consistirá en:

Transformar el dataset a un formato amigable para su análisis. Encontrar y analizar valores atípicos y sus posibles causas.

Obtención de datos desde fuentes no convencionales como APIs o PDF o WebScraping y análisis de su correctitud.

16/8 práctico de introducción al aprendizaje automático, que consistirá en:

Analizar dataset, features existentes y objetivo a predecir (posibilidad de crear nuevas features). Preparar correctamente los datos y analizar diferentes modelos e hiperparámetros, evaluando sus resultados de acuerdo a las métricas obtenidas por cada modelo.

13/9 práctico de aprendizaje supervisado, que consistirá en:

Continuación de lo visto en el práctico de introducción a ML con aplicación de modelos más complejos o acorde al tipo de datos analizados.

27/9 práctico de aprendizaje no supervisado, que consistirá en:

Análisis aplicando técnicas no supervisadas para encontrar clusters en la data.

Generación y análisis de clusters regionales o temporales y su interpretación de acuerdo al problema.

6/11/2020 – 7/11/2020 presentación de mentorías