En la sección anterior hemos visto diferentes técnicas para seleccionar aquellas características predictivas más relevantes -disminuyendo, por lo tanto, la dimensionalidad del dataset-, pero sin que los valores de las características seleccionadas se vieran modificadas. Una alternativa a este enfoque es la llamada feature extraction o extracción de características, conjunto de métodos con los que se busca transformar los datos originales a un espacio de menor dimensionalidad, intentando extraer la mayor cantidad de información.