Resumen

Resumiendo: Para aplicar el algoritmo de descenso de gradiente, partimos de un punto aleatorio (a, b). A continuación, calculamos el gradiente (las derivadas parciales) de la función de coste con respecto a ambas variables. Restamos a los valores de a y b sus derivadas parciales multiplicadas por la tasa de aprendizaje, y repetimos el proceso hasta que el gradiente calculado sea cero (o muy pequeño), en cuyo caso estaremos en un mínimo de la función de coste (o muy próximos a él).