El entrenamiento de una regresión lineal es muy sencillo pues existen ecuaciones matemáticas que nos devuelven los parámetros del algoritmo directamente. Así, si la relación entre las variables predictivas y la variable objetivo es la ya comentada:
...podemos expresar esta misma ecuación de la siguiente forma:
Donde W es el vector con los coeficientes, WT es la transpuesta de W (resultado de mostrar el vector no verticalmente sino horizontalmente) y X es el vector de características:

Usando esta nomenclatura, la función de coste "error cuadrático medio" puede expresarse de la siguiente forma:

Donde Xi es el vector de características correspondiente a la muestra i-ésima.