La ingeniería de características es un proceso esencial en el preprocesamiento de datos para mejorar la calidad y la relevancia de las características utilizadas en un modelo de aprendizaje automático. A menudo, los datos originales no son adecuados para su uso directo en un modelo de aprendizaje automático, y es necesario realizar una serie de transformaciones para extraer la información relevante y eliminar ruido.
La ingeniería de características hace referencia al proceso de seleccionar, construir y transformar características en un conjunto de datos para mejorar la precisión y la eficiencia de un modelo de aprendizaje automático. Este proceso puede involucrar la extracción de características a partir de datos brutos, la selección de características relevantes (y la eliminación de las no relevantes) y la creación de nuevas características a partir de características existentes.
En esta sección, exploraremos algunas de las técnicas más comunes de ingeniería de características.