Scikit-Learn incluye tres diferentes APIs para evaluar la calidad de una predicción:
- Método "score": Todos los algoritmos incluyen un método "score" que provee el resultado de un criterio de evaluación por defecto para aquel problema al que están orientados. De esta manera, el método score de un modelo de clasificación basado en árbol de decisión, DecisionTreeClassifier, devuelve la precisión del modelo, entendida como el porcentaje de valores clasificados correctamente con respecto al total de elementos. O una regresión lineal devuelve el coeficiente de determinación, o R2, entendida como el porcentaje de la variancia de la variable dependiente que es predecible a partir de la variable independiente.
- Parámetro de scoring: Algunas herramientas de evaluación de modelos que utilizan validación cruzada (como cross_val_score o GridSeachCV) incluyen sus propias medidas de calidad.
- Funciones de métrica: La sublibrería sklearn.metrics implementa un buen número de medidas de evaluación de errores de predicción para objetivos específicos.