El método dropna

El método dropna permite, de una forma muy conveniente, filtrar los valores de una estructura de datos pandas para dejar solo aquellos no nulos.

Aplicado a una serie, el método pandas.Series.dropna devuelve una nueva serie tras eliminar los valores nulos:

El método dropna

Aplicado a un dataframe, el método pandas.DataFrame.dropna ofrece algo más de funcionalidad: podemos escoger si queremos eliminar filas o columnas, y si queremos eliminarlas cuando todos sus elementos sean nulos o simplemente cuando alguno de ellos lo sea. Por ejemplo:

El método dropna

Por defecto, el método se aplica al eje 0, es decir, va a eliminar filas que incluyan valores nulos:

El método dropna

Si especificamos el eje 1, lo que se eliminan son las columnas que incluyan valores nulos:

El método dropna

Mediante el parámetro how podemos controlar cómo queremos que se aplique el método: si toma el valor "all", solo se eliminarán las filas o columnas en las que todos sus elementos sean nulos. Si toma el valor "any" (valor por defecto), se eliminarán las filas o columnas en las que algún elemento sea nulo. De esta forma:

El método dropna

Vemos cómo ninguna fila se ha eliminado pues en ninguna de ellas todos los elementos nulos.