TPR-FPR

Si estos enfoques son el True Positive Rate (TPR, recall o exhaustividad) y el False Positive Rate (especificidad o selectividad) nos encontramos con que podemos calificar la bondad de un clasificador con el siguiente esquema, en el que hemos marcado los valores de TPR y FPR para cinco clasificadores distintos (A, B, C, D y E):

Curva ROC

Ya hemos visto que el FPR toma valores en el rango 0 (para el clasificador ideal) y 1 (para el peor clasificador posible), y que el TPR toma valores en el rango 0 (para el peor clasificador posible) y 1 (para el clasificador ideal). Esto significa que:

  • El clasificador A tiene el mejor FPR posible (no detecta como positivos ninguna muestra negativa) pero tiene el peor TPR (ninguna muestra positiva la identifica como tal).
  • El clasificador B tiene el mejor FPR y el mejor TPR. Se trata del clasificador ideal.
  • El clasificador C tiene el peor FPR (todas las muestras negativas son identificadas como positivas) pero su TPR es el mejor posible (todas las muestras positivas son identificadas como tal).
  • El clasificador D tiene un FPR de 0.5 (la mitad de las muestras negativas las identifica como tal. La otra mitad las identifica erróneamente como positivas), y un TPR también de 0.5 (la mitad de las muestras positivas las identifica como tal, e identifica la otra mitad erróneamente como negativas).
  • Por último, el clasificador E tiene el peor FPR posible (todas las muestras negativas son identificadas como positivas) y el peor TPR posible (ninguna muestra positiva es identificada como tal). Es el peor clasificador posible (todas las predicciones son erróneas).

En todo caso, este método de calificación de clasificadores va más allá que lo contado hasta ahora. Pero lo que falta por contar se aplica a clasificadores lineales, por lo que dejaremos el resto de la explicación para más adelante... (si no puedes esperar, aquí tienes un enlace a la sección correspondiente)