Regresión logística

Al contrario que los algoritmos lineales vistos hasta ahora, el modelo de regresión logística se utiliza en escenarios de clasificación. Este algoritmo también se conoce como regresión logit, o clasificador de máxima entropía, y se encuadra dentro de los conocidos como modelos lineales generalizados.

La regresión logística describe la probabilidad de que la variable objetivo pertenezca a una clase o a otra: dado un cierto valor límite, si el valor de la variable objetivo iguala o excede dicho valor, se devuelve como predicción la clase "positiva". En otro caso se devuelve como predicción la clase "negativa". Para ello se utiliza la función logística, que siempre devuelve un valor entre 0 y 1:

Función logísticaFunción logística

Scikit-Learn implementa la regresión logística en la clase sklearn.linear_model.LogisticRegression. Esta implementación permite añadir las penalizaciones L1 o L2 utilizando el argumento penalty. El argumento solver determina el algoritmo de optimización a usar ("newton-cg", "lbfgs", "liblinear", "sag" o "saga") y, en el caso de estar en un escenario multiclase, el argumento multi_class permite escoger la estrategia a seguir: uno contra los demás ("ovr", one-vs-rest) o un criterio de pérdida de entropía cruzada.