Derivada parcial con respecto a un peso

Esquema de la red neuronal

Volviendo a nuestra red, si partimos de la función de coste comentada:

C = ?(ŷi - yi)2 = ?Ci

...podríamos comenzar calculando la derivada parcial de Ci con respecto a w31. Si tenemos en cuenta que Ci depende de la predicción ŷi, que esta predicción depende a su vez de z3, y que z3 depende de w31, podríamos aplicar la regla de la cadena de la siguiente forma:

Cálculo de la derivada de la función de error

Las funciones Ci, ŷi  y z3 son conocidas y expresables con respecto a ŷi , z3 y w31 respectivamente:

Cálculo de la derivada de la función de error

Si calculamos las derivadas parciales que nos interesan:

Cálculo de la derivada de la función de error

(σ' es la derivada de la función de activación)

...y combinamos todo, obtenemos la siguiente expresión:

Cálculo de la derivada de la función de error

Todos estos valores son conocidos: la predicción ŷi, el valor objetivo yi, la derivada de σ (ya que es una función conocida como la sigmoide) y el valor a1 devuelto por la neurona 1.