Los algoritmos supervisados son aquellos que parten de un conjunto de “datos etiquetados” (es decir, datos para los que se conocen las características predictivas y sus respectivas etiquetas), aprenden la relación entre las características y las etiquetas, extraen un patrón que relaciona ambos bloques de datos, y permiten aplicar este patrón a conjuntos de datos “no etiquetados” (datos para los que solo se conocen las características predictivas) para predecir su etiqueta. El objetivo es ser capaces de "generalizar" un patrón a partir de ejemplos concretos, lo que se conoce como aprendizaje por inducción.
Dentro de este primer tipo de algoritmos tenemos aquellos que predicen el valor de una variable continua -es decir, un número- (como, por ejemplo, predecir la probabilidad de tener un accidente de coche) -algoritmos llamados de regresión-, y aquellos que predicen la categoría a la que pertenece cada registro (como, por ejemplo, identificar si la imagen mostrada en una fotografía pertenece a un perro o a un gato). Estos algoritmos son llamados de clasificación o clasificadores.
Desde un punto de vista un poco más matemático, podemos decir que los algoritmos supervisados tienen como objetivo construir una función (el modelo) capaz de convertir los datos de entrada (las características predictivas conocidas) en los datos de salida (las etiquetas conocidas). Una vez obtenida esta función, ya podríamos aplicarla a otros datos de entrada (a otras características predictivas) para obtener sus datos de salida (es decir, para predecir sus etiquetas).