Tecnología utilizada
Utilicé el lenguaje de programación Python para el análisis de datos.
Apliqué las librerías de Pandas, Numpy y Seaborn.
Tecnología utilizada
Utilicé PostgreSQL para la consulta de datos.
Responsabilidades
Contar los nombres de dinosaurios únicos.
Determinar el dinosaurio más grande por longitud.
Contar las apariciones de cada tipo de dinosaurio.
Obtener el tipo de dinosaurio más frecuente.
Responsabilidades
Contar las películas que hay en la base de datos.
Recomendar al gerente sobre que hacer con estas filas.
Contar las clasificaciones que hay en la base de datos.
Encontrar los top cinco países en términos de cantidad de películas producidas.
Comparar la duración promedio de las películas inglesas con las francesas.
Calcular la correlación entre el presupuesto y los ingresos brutos.
Resultados
Hay 1.042 nombres de dinosaurios únicos en el conjunto de datos.
El dinosaurio más grande por longitud tiene 35,0.
El tipo de dinosaurio más frecuente es el ornitópodo con 811 apariciones.
Existe una relación significativa entre la edad y la longitud de los dinosaurios debido a que la edad disminuye a medida que aumenta la longitud. En conclusión, sí, los dinosaurios efectivamente se hicieron más grandes con el tiempo.
Resultados
Hay 4.968 películas en la base de datos.
Recomiendo analizar la extensión y el patrón de los datos faltantes.
Si hay muchos datos faltantes, usar técnicas de imputación o recopilar datos adicionales. Sino eliminar las filas con datos faltantes que sean valores atípicos.
Hay 13 clasificaciones diferentes en el conjunto de datos.
Los top 5 países son: Estados Unidos, Reino Unido, Francia, Canadá y Alemania.
La duración promedio de las películas en inglés y francés es de 108 y 105 minutos respectivamente.
La correlación entre el presupuesto y los ingresos brutos es de 0,103.
Ve los proyectos aquí: https://www.datacamp.com/datalab/w/231fd32a-8ff7-440c-b5dd-a7480ac3241e