¿Qué es la libreria pandas?
Pandas es una librería de Python diseñada para facilitar el manejo y análisis eficiente de datos. Ampliamente utilizada en el ámbito de la ciencia de datos, Pandas proporciona herramientas esenciales para analistas de datos. Sus estructuras principales, las Series y los DataFrames, permiten almacenar datos de manera unidimensional y bidimensional, respectivamente. Pandas ofrece una variedad de funciones para operaciones como lectura/escritura de datos, manipulación y visualización. En la práctica, esta librería se emplea para diversas tareas, como la importación y limpieza de datos, manipulación para análisis, generación de informes y visualizaciones, así como el desarrollo de modelos de aprendizaje automático.
Ventajas de la libreria pandas
Ofrece dos tipos de objetos principales: DataFrame y Series, que permiten almacenar y operar con datos de forma flexible y eficiente.
Dispone de métodos para leer y escribir datos desde diferentes fuentes, como archivos CSV, Excel, SQL, JSON, etc.
Proporciona funciones para realizar operaciones estadísticas, agrupaciones, filtrados, ordenamientos, combinaciones, transformaciones, etc.
Facilita la visualización de los datos mediante gráficos integrados con la librería matplotlib.
Soporta el manejo de datos faltantes, duplicados, no válidos o con formatos inconsistentes.
Se integra fácilmente con otras librerías de Python, como numpy, scipy, scikit-learn, etc.
Ejemplo
Ordenar los países del mundo por mayor población (2022)
import pandas as pd
from google.colab import files
uploaded=files.upload()
datos = pd.read_excel("Población_Por_País_1960-2022.xlsx")
df = pd.DataFrame(datos, columns=['Country Name','2020'])
df.sort_values(by="2020", ascending=False)