R2, el coeficiente de determinación, determina la capacidad de un modelo para predecir futuros resultados. El mejor resultado posible es 1.0, y ocurre cuando la predicción coincide con los valores de la variable objetivo. R2 puede tomar valores negativos pues la predicción puede ser arbitrariamente mala. Cuando la predicción coincide con la esperanza de los valores de la variable objetivo, el resultado de R2 es 0. Se define como 1 menos la suma de cuadrados totales dividido por la suma de cuadrados de los residuos:
...donde:
- yi son los valores que toma la variable objetivo
- pi son los valores de la predicción
- ȳ es el valor medio de los valores que toma la variable objetivo
Scikit-Learn implementa esta métrica en sklearn.metrics.r2_score:
from sklearn.metrics import r2_score
r2_score([2, 5, 9], [3, 5, 11])
0.7972972972972973