Además de escoger una función de error que determine cómo el aprendiz va a "aprender", podemos estar interesados en evaluar nuestro modelo. Si hemos escogido el error cuadrático medio -por ejemplo- como función de error, lo lógico es que, una vez hayamos entrenado el modelo, estemos interesados en cuál es el error cuadrático medio final cometido al aplicar el modelo a un conjunto de pruebas. Pero podríamos estar interesados en ver el comportamiento del modelo "bajo otros prismas". Por ejemplo, podemos estar interesados en calcular también el coeficiente de determinación (R2) o el error absoluto medio...
Fíjate que el concepto que hay detrás de la función de error y de la métrica es el mismo tanto si se usa para optimizar el modelo como si lo usamos para evaluar el modelo ya entrenado. En el primer caso, el error va a depender de ciertas variables (permitiendo el cálculo de su gradiente, etc.). Por el contrario, cuando deseamos evaluar el modelo con con una métrica que mida dicho "error" aplicándolo a datos de prueba, se va a devolver un número.