En el caso de trabajar con el error cuadrático medio (mean squared error) la función de impureza viene dada por la siguiente fórmula:
Por poner un ejemplo sencillo, si en un nodo hay 4 muestras cuyas etiquetas son 2, 4, 5 y 8, el valor medio ȳ es de 4.75, y el error cuadrático medio vendrá dado por:
mean = (2 + 4 + 5 + 8) / 4
mse = 1/4 * ((2 - mean) ** 2 + (4 - mean) ** 2 + (5 - mean) ** 2 + (8 - mean) ** 2)
mse
4.6875