Los algoritmos basados en árboles de decisión son ampliamente usados tanto en análisis de regresión como en clasificación y, en entornos tabulares, son los que frecuentemente ofrecen mejor rendimiento. Básicamente generan una estructura tipo "árbol de decisión" conteniendo preguntas de tipo "if-else" que permiten alcanzar el valor buscado. Una vez construido el árbol a partir del conjunto de datos de entrenamiento, es posible realizar predicciones haciendo pasar a los nuevos puntos por el árbol, respondiendo a cada una de las preguntas.
Una de las grandes ventajas de este tipo de algoritmos es que no son sensibles a la escala de los datos, lo que simplifica la fase de preprocesamiento.