Visualización de datos de alta dimensionalidad con PCA

De lo visto es fácilmente deducible que una de las posibles aplicaciones de un algoritmo de reducción de dimensionalidad como PCA es la visualización en 2 o 3 dimensiones de conjuntos de datos de un mayor número de dimensiones. Apliquemos esta técnica para llevar a un plano las cuatro características numéricas del dataset Iris:

Cargamos el dataset e instanciamos el algoritmo, especificando 2 componentes:

iris = sns.load_dataset("iris")

pca = PCA(n_components = 2, random_state = 0)

Lo entrenamos y aplicamos la transformación:

iris_t = pca.fit_transform(iris.drop("species", axis = 1))

Por último, mostramos los datos transformados:

sns.scatterplot(iris_t[:, 0], iris_t[:, 1], hue = iris.species);

PCA para visualizar datos de alta dimensionalidad