Ejemplo de entrenamiento

Y volviendo al entrenamiento del Perceptrón, pongamos un ejemplo del proceso a seguir. Veíamos que los datos de entrenamiento eran:

Y recordemos que el valor resultante del sumatorio, z, tenía la siguiente expresión:

z = w₀x₀ + w₁x₁ + w₂x₂

Supongamos que los pesos se inicializan con los valores w₀ = 0, w₁ = -1, w₂ = 1 y escogemos una tasa de aprendizaje de 0.1 (estos valores no son muy reales, pero nos sirven para entender el proceso). Pasaríamos la primera muestra x⁽¹⁾ = (2, 1):

z = w₀x₀ + w₁x₁ + w₂x₂ = 0*1 + (-1)*2 + 1*1 = 0 - 2 + 1 = -1

Es decir, se obtiene un valor menor que 0, lo que supone que la neurona no se va a activar y devolverá un valor ŷ = 0, aun cuando la etiqueta asociada a esta muestra es 1. Si calculamos los incrementos a aplicar a cada peso:

Δw₀ = η(y – ŷ).x₀ = 0.1*(1 – 0)*1 = 0.1

Δw₁ = η(y – ŷ).x₁ = 0.1*(1 – 0)*2 = 0.2

Δw₀ = η(y – ŷ).x₂ = 0.1*(1 – 0)*1 = 0.1

Por lo que los pesos quedarían ahora con los siguientes valores:

w₀ = w₀ + Δw₀ = 0 + 0.1 = 0.1

w₁ = w₁ + Δw₁ = -1 + 0.2 = 0.8

w₂ = w₂ + Δw₂ = 1 + 0.1 = 1.1

Vemos que los pesos se han modificado un poco de forma que la neurona tienda a un estado en el que obtener la etiqueta correcta para la muestra x⁽¹⁾ sea un poco más probable. Y, tal y como se ha comentado, la velocidad del cambio de los pesos viene determinada por la tasa de aprendizaje, η.

Si la predicción realizada por la neurona, ŷ, hubiese coincidido con la etiqueta de la muestra, y, los incrementos a aplicar a los pesos hubiesen sido igual a cero.

Acerca de Interactive Chaos

Información de contacto