Histogramas de una variable

Un histograma es una representación de una variable utilizando barras verticales en la que el tamaño de cada barra es proporcional a la frecuencia de los valores representados. Este tipo de gráfica nos permite saber rápidamente cuál es la distribución de los datos respecto a una característica.

La función matplotlib.pyplot.hist es la encargada de crear histogramas (funcionalidad también disponible como método de un conjunto de ejes). La función recibe como primer argumento el conjunto de datos, en forma de array o tipo semejante. Hagamos un ejemplo sencillo:

Histogramas

Hemos generado 10.000 números aleatorios extraídos de una distribución normal de media 0 y desviación estándar 1, y los hemos pasado a la función, mostrándose las barras con una altura proporcional al número de elementos representados en cada barra. Así, vemos que éstas representan valores entre 0 y 1, entre 1 y 2, entre 2 y 3, etc. Comprobamos también que la barra más alta (la correspondiente a los valores entre 0 y 1) llega hasta el valor (aproximado) de 2.800, lo que significa que, de los 10.000 números, hay unos 2.800 entre dichos valores.