Sobreentrenamiento

La respuesta a la pregunta anterior es muy simple: porque corremos el riesgo de sobreentrenar al algoritmo. Si, en lugar de tres niveles (y tres preguntas a ser respondidas antes de alcanzar una hoja del árbos) tuviésemos, digamos, 80 niveles (y, por lo tanto, 80 preguntas a responder), podría ocurrir que para llegar a una de las hojas del árbol un conductor tuviese que "llamarse Roberto, haber nacido el 15 de enero de 1966, ser hijo de José y de Ángeles, tener ojos marrones, un Audi rojo con 112 CV y una pegatina de las Lagunas de Ruidera en la luneta trasera del coche" -entre otras características-, lo que puede definir perfectamente el perfil de un conductor concreto (Roberto), pero ser muy difícilmente aplicable a otros conductores. Es decir, si somos muy estrictos a la hora de clasificar a los conductores, perdemos capacidad de generalizar los resultados que obtengamos.