Ya se ha comentado que, en los algoritmos supervisados, debemos partir de datos conocidos (características predictivas y etiquetas) de forma que el algoritmo pueda extraer un patrón que relacione ambos bloques de datos y que sea aplicable a nuevas características predictivas con el objetivo de predecir su etiqueta.
O que, en los algoritmos no supervisados, el objetivo es identificar patrones y estructuras en los datos con el objetivo de extraer de ellos información relevante.
Pues bien, el entrenamiento es el nombre que damos al proceso por el cual los datos de los que partimos son interpretados por el algoritmo para que éste se configure de la forma adecuada (es decir, para que extraiga el patrón o la información buscada). Este proceso de entrenamiento depende del tipo de algoritmo, por lo que no es posible generalizar una definición que sirva en todos los casos.
En el caso de los algoritmos supervisados, por ejemplo, durante el entrenamiento, el modelo ajusta sus parámetros internos para minimizar la diferencia entre las predicciones que realiza y los valores reales en el conjunto de datos de entrenamiento del que partimos.