Pandas | ||
---|---|---|
Información general | ||
Tipo de programa | biblioteca de Python | |
Autor | Wes McKinney | |
Desarrollador | Comunidad | |
Modelo de desarrollo | Software libre | |
Lanzamiento inicial | 11 de enero de 2008 | |
Licencia | Licencia BSD | |
Información técnica | ||
Programado en | Python | |
Versiones | ||
Última versión estable | 2.2.2 / 10 de abril de 2024 () | |
Archivos legibles | ||
Hierarchical Data Format | ||
Archivos editables | ||
Hierarchical Data Format | ||
Enlaces | ||
Pandas es una librería de Python especializada en la manipulación y el análisis de datos. Ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales, es como el Excel de Python. Es un software libre distribuido bajo la licencia BSD.[1] El nombre deriva del término "datos de panel", término de econometría que designa datos que combinan una dimensión temporal con otra dimensión transversal.[2]
La biblioteca ha sido altamente optimizada en cuanto a rendimiento, con caminos de código crítico escritos en Cython o en C.[4]
Su principal desarrollador, Wes McKinney, empezó a desarrollar Pandas en el año 2008 mientras trabajaba en AQR Capital por la necesidad que tenía de una herramienta flexible de alto rendimiento para realizar análisis cuantitativo en datos financieros.[5] Antes de dejar AQR convenció a la administración de la empresa de distribuir esta biblioteca bajo licencia de código abierto. Otro empleado de AQR, Chang Ella, se unió en 2012 al esfuerzo de desarrollo de la biblioteca.[cita requerida]
Curvas
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()
Gráfica de barras
df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()
Diagrama de caja
df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()
Histograma
data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()