Boston

Boston

El dataset Boston está incluido en sklearn y ofrece valores medios de inmuebles en Boston a partir de características como la antigüedad del mismo, la tasa de criminalidad en la zona, etc.:

from sklearn.datasets import load_boston

dataset = load_boston()
dataset.keys()

dict_keys(['data', 'target', 'feature_names', 'DESCR', 'filename'])

La estructura devuelta por la instrucción anterior es un diccionario en el que los datos, la variable objetivo, los nombres de las características, la descripción del dataset y el fichero en el que está contenido se muestran en valores diferentes. Podemos crear un dataframe con las características y la variable objetivo de la siguiente forma:

boston = pd.DataFrame(dataset.data, columns = dataset.feature_names)
boston["target"] = dataset.target
boston.head()

Dataset Boston
boston.shape
(506, 14)

Como vemos, se trata de un dataset de 506 registros y 13 características predictivas (además de incluir la variable objetivo, por supuesto).