Pongamos un par de ejemplos. Trabajando con dos clases (escenario binomial), tendríamos lo siguiente:
from sklearn.metrics import accuracy_score
y_real = [0, 0, 1, 1]
y_pred = [0, 0, 1, 0]
accuracy_score(y_real, y_pred)
0.75
...es decir, el 75% de las muestras están bien clasificadas.
En un entorno multiclase:
y_real = [0, 0, 1, 1, 2, 2, 2]
y_pred = [0, 0, 1, 0, 2, 2, 0]
accuracy_score(y_real, y_pred)
0.7142857142857143
...es decir, 5 / 7 (= 0.714) de las muestras están bien clasificadas.