Por último, el conjunto de datos de prueba (o de test) es un conjunto de datos sobre el que vamos a aplicar nuestro modelo una vez ha sido entrenado para confirmar su rendimiento real. Se trata de datos conocidos también (igual que los dos dos conjuntos de datos anteriores) pero son datos que el algoritmo no ha visto en ningún momento, de forma que podemos aplicar el modelo sobre él, realizar la predicción y comprobar si ésta se ajusta mejor o peor a la realidad. En la literatura en inglés este conjunto también recibe el nombre de hold-out.