Antes de nada, hemos visto que en la aplicación de la regla de la cadena para el cálculo de la derivada parcial de la función de error correspondiente a un peso o a un bias era necesario implicar la derivada de la función de activación que, en nuestro caso, es la función sigmoide:
![Función sigmoide](/sites/default/files/styles/max_800_px/public/2020-09/tutdl_0040.jpg)
Sin entrar en el detalle del método de cálculo, la derivada de esta función tiene la siguiente expresión:
![Derivada de la función sigmoide](/sites/default/files/styles/max_800_px/public/2020-11/tutdl_0134.jpg)
...que también puede escribirse en función de la propia función sigmoide:
![Derivada de la función sigmoide](/sites/default/files/styles/max_800_px/public/2020-11/tutdl_0135.jpg)
La codificación de esta derivada podría ser, por lo tanto, la siguiente:
def sigmoid_derivative(x):
""" Derivada de la función sigmoide """
return sigmoid(x) * (1 - sigmoid(x))