Tutorial de pandas

Tutorial de pandas

Bienvenid@ a este tutorial de pandas. Esta librería ofrece dos de las estructuras más usadas en Data Science: la estructura Series y el DataFrame (nombres con los que se muestran en la documentación de pandas y que llamaremos aquí serie -en español- y dataframe -en minúsculas-, respectivamente, por comodidad). En este tutorial veremos cómo crearlas, las herramientas básicas de uso y algunas de las funciones y métodos que nos permitirán extraer todo el potencial de ellas.

Para el seguimiento del tutorial deberás tener instalado Python 3.7 y la librería pandas. Mi recomendación es que simplemente instales Anaconda pues incluye Python, el entorno Jupyter e instala automáticamente decenas de librerías usadas en Data Science -incluyendo, por supuesto, pandas-. Jupyter es una aplicación web que permite crear documentos divididos en celdas en las que poder ejecutar Python, aplicación en la que están hechos todos los ejemplos mostrados en este tutorial.

Doy por sentado que tienes conocimientos de programación en Python -aunque sean limitados-: que conoces los diferentes tipos de datos (listas, tuplas...), cómo usar estas estructuras, etc. Aunque no es imprescindible, resulta extremadamente conveniente tener conocimientos de NumPy, material cubierto en este otro tutorial.