La función sigmoide

Sin embargo, resulta obvio que, si el objetivo es predecir la probabilidad de un cierto evento, la relación entre las variables independientes mencionadas y la etiqueta (la probabilidad) no puede ser del tipo

p = a₁*x₁ + a₂*x₂ + … + a_n*x_n [2]

entre otras cosas porque la probabilidad p va a tomar un valor en el rango [0, 1], mientras que nuestra combinación línea va a devolver valores potencialmente en el rango (-∞, +∞).

Para solucionar este problema no se considera la probabilidad a la izquierda de la igualdad en [2], sino la función logit que, aun involucrando la probabilidad p, tiene como rango (-∞, +∞). Esta función está definida de la siguiente forma:

Si llevamos esta función a una gráfica, podemos ver su forma:

Es decir, nuestro modelo vendrá definido por la expresión

Como el objetivo es aproximar la probabilidad del evento, podemos extraer la variable p de la ecuación. Para ello obtenemos la exponencial de las expresiones a ambos lados de la igualdad:

Multiplicamos por (1 - p):

Multiplicamos la exponencial por los dos términos en el paréntesis:

Pasamos las probabilidades al lado izquierdo de la igualdad:

Sacamos p como factor común de la suma:

Y despejamos:

Esta expresión suele mostrarse tras dividir el numerador y el denominador por la exponencial:

O, lo que es lo mismo:

(pues recordemos que )

Por último, ya se ha comentado que a₁x₁ + a₂x₂+ ⋯ + a_nx_n es lo que veníamos denominando net input o z, por lo que la ecuación queda finalmente de la siguiente forma:

Esta es la llamada función sigmoide y su aspecto es el siguiente:

Acerca de Interactive Chaos

Información de contacto