Linear Discriminant Analysis (LDA, Análisis Discriminante Lineal) es una técnica de clasificación supervisada que busca encontrar una combinación lineal de características que maximice la separación entre clases en un conjunto de datos de entrenamiento. Al igual que hemos visto con PCA, LDA puede ser usado para reducir la dimensionalidad de un conjunto de datos manteniendo la información más relevante. Existen, en todo caso, importantes diferencias entre ambos enfoques:
- PCA busca encontrar una representación de baja dimensionalidad de los datos que maximice la varianza total de los datos de entrada, mientras que LDA busca encontrar una representación de baja dimensionalidad de los datos que maximice la separación entre clases en un conjunto de datos etiquetados.
- PCA es una técnica de aprendizaje no supervisado, mientras que LDA es una técnica de aprendizaje supervisado que utiliza las etiquetas de clase para guiar la reducción de dimensionalidad.
- PCA utiliza todas las características en el conjunto de datos de entrada, mientras que LDA utiliza solo un subconjunto de características que mejor separan las clases. En otras palabras, LDA es una técnica de selección de características, además de una técnica de reducción de dimensionalidad.