Y un poco más de matemáticas que nos van a resultar especialmente útiles: la derivada con respecto de x de una suma de funciones es igual a la suma de las derivadas de cada función con respecto a x. Es decir:
Y, por supuesto, lo mismo se cumple para la derivada parcial de una suma de funciones:
Y esto nos resulta especialmente útil pues habíamos definido el error de nuestra red como la suma de los errores cometidos para cada muestra de nuestro dataset de entrenamiento:
C = ?(ŷi - yi)2
Si queremos calcular la fórmula de la derivada parcial de esta función de coste con respecto a un parámetro, podemos simplemente considerar la función de coste para una única muestra:
Ci = (ŷi - yi)2
...calcular la derivada parcial de esta función con respecto al parámetro, y añadir el sumatorio posteriormente.