Duración
12-20 horas
El llamado "stack científico de Python" incluye algunas librerías básicas en el proceso de análisis de datos, librerías que van a permitirnos almacenar y transformar datos, así como visualizarlos. En este curso conoceremos la librería NumPy y su array multidimensional, la librería Pandas y las estructuras que nos ofrece -Series y DataFrame-, y aprenderemos a mostrar de forma gráfica los datos usando las librerías matplotlib y Seaborn, lo que resultará especialmente útil tanto en el análisis exploratorio previo al análisis como en la comunicación del resultado del análisis.
Contenido
NumPy
- Introducción a NumPy
- El array multidimensional
- Indexado y selección
- Ordenación y concatenación de arrays
- Operaciones con arrays
- Funciones NumPy
- La sublibrería numpy.random
Pandas
- Introducción a Pandas
- Series y DataFrames
- Selección de datos
- Operaciones con estructuras Pandas
- Reindexación y Multi-indexación
- Ordenación y clasificación
- Aplicación de funciones y mapeado
- Limpieza de datos con Pandas
- Agrupaciones
matplotlib
- Visualización de datos con matplotlib
- Nomenclatura
- Interfaces de programación
- Figuras y ejes
- Gráficos estáticos y dinámicos
- Gráficos en 3D
- Gestión de imágenes
Seaborn
- Funciones a nivel de figura y de ejes
- Distribuciones
- Relaciones entre variables cuantitativas
- Relaciones entre variables cuantitativas y cualitativas
- Modelos estadísticos
- Mapas de calor
- Configuración de visualizaciones