Las redes neuronales artificiales (artificial neural networks, ANN) o, simplemente, redes neuronales, son un modelo computacional basado en el comportamiento observado en sus equivalentes biológicos. Están formadas por un conjunto de unidades de procesamiento denominadas neuronas artificiales, unidas unas con otras, que transforman los datos de entrada que llegan a ellas en otros datos de salida. La información que llega a la red neuronal la recorre mientras se transforma en cada neurona artificial atravesada, hasta alcanzar el final de la red, en el que se devuelve el valor resultante.
Las neuronas artificiales que forman una red neuronal pueden ser consideradas versiones modernas de la Adaline. Concretamente, vimos que en la Adaline el valor z (al que llamábamos también net input o entrada neta) pasaba por una función identidad (es decir, no se modificaba) y era éste el valor que se consideraba para calcular el error de la neurona (dicho valor se pasaba a continuación por una función escalón para devolver una de las dos clases en las que este algoritmo podía clasificar una muestra).
En una neurona artificial moderna, la entrada neta pasa por una función de activación que puede ser una función sigmoidea u otras, y es este valor resultante el que se devuelve como valor de salida, sirviendo también para evaluar el error cometido por la neurona.
El esquema de ambas neuronas artificiales es el siguiente:
Esta semejanza, en todo caso, puede llevarnos a engaño, pues hoy día el concepto de neurona artificial tiene poco sentido salvo considerada como parte de una estructura más compleja (una red neuronal). Si bien la idea de crear redes neuronales artificiales usando la salida de unas neuronas como entradas de otras se remonta a la década de 1960, han sido tantas las arquitecturas de redes neuronales que se han desarrollado a lo largo de estas décadas que resulta muy difícil hablar de "redes neuronales" como un único algoritmo. Muy por el contrario, las redes neuronales hoy en día pueden ser vistas como un conjunto de herramientas diversas y técnicas que se pueden utilizar en una amplia variedad de tareas de aprendizaje automático y procesamiento de datos.