pandas

Destaque de una celda de un DataFrame pandas al mover el cursor por encima

El método de un DataFrame .style.set_table_styles() nos permite aplicar estilos CSS a la visualización del DataFrame. Tal y como indica la documentación, el argumento a pasar al método deberá ser una lista de diccionarios formados por valores "selector" y "props", siendo los primeros selectores CSS y los segundos parejas de tuplas formadas por atributos CSS y valores.

Enviado por admin el Mar, 23/06/2020 - 10:48

División de un dataframe en bins definidos por una característica

El objetivo en este escenario es, partiendo de un dataframe, generar bins (bloques) definidos por los valores que tome una de las características y, a continuación, dividir el dataframe según estos bins.

Veamos un ejemplo muy sencillo: Supongamos que estamos trabajando con el dataset Iris y queremos dividirlo en N grupos en función de los valores que tome la característica "sepal_length". Tendríamos que crear N bins basados en los valores de sepal_length y, a continuación, asignar cada registro del dataframe a uno de los bins.

Enviado por admin el Mar, 13/08/2019 - 09:54

Codificación One Hot Encoding de una característica categórica con pandas

En este escenario vamos a aplicar el método de codificación One Hot Encoding a las características categóricas del dataset Titanic proveído por seaborn. Para ello utilizaremos la función get_dummies de pandas. Comencemos cargando el dataset y examinándolo:

titanic = sns.load_dataset("titanic")

titanic.head()

Enviado por admin el Dom, 14/04/2019 - 18:45

Distribución de los elementos de una serie Pandas según su frecuencia

La función value_counts() de Pandas nos permite calcular el número de apariciones de cada elemento único en una serie Pandas, devolviendo un listado de elementos únicos y el número de apariciones de cada uno. Pero podríamos estar interesados no en el número de veces que aparece cada elemento, sino en el número de elementos que aparecen N veces, para todos los valores posibles de N.

Enviado por admin el Lun, 03/12/2018 - 21:32

Cálculo del número de apariciones de cada elemento en una serie Pandas

Si queremos calcular el número de veces que cada elemento aparece en una serie pandas (o en una columna de un dataframe pandas), podemos recurrir a la función value_counts() de dicha librería. Por ejemplo, consideremos el siguiente dataframe:

df = pd.DataFrame({
  "a": [1, 2, 1, 5]
})

Podemos calcular el número de apariciones de cada elemento con la siguiente instrucción:

df["a"].value_counts()

Enviado por admin el Lun, 03/12/2018 - 21:31