En el campo del aprendizaje automático, los algoritmos se utilizan para analizar y hacer predicciones o decisiones basadas en datos. Existen tres tipos principales de algoritmos: supervisados, no supervisados y de refuerzo. Estos algoritmos difieren en la forma en que se entrenan y en el tipo de salida que producen.
- Los algoritmos de aprendizaje supervisado se entrenan utilizando datos etiquetados, que consisten en datos de entrada y la salida correcta correspondiente. El algoritmo hace predicciones basándose en esta asignación de entrada-salida. Por ejemplo, se podría utilizar un algoritmo de aprendizaje supervisado para predecir si un paciente tiene una determinada enfermedad en función de ciertas características del paciente (datos de entrada) y la presencia o ausencia de la enfermedad (datos de salida). Algunas aplicaciones comunes del aprendizaje supervisado incluyen el reconocimiento de imágenes y de voz, y el filtrado de correo no deseado.
- Los algoritmos de aprendizaje no supervisado no tienen datos de entrenamiento etiquetados. En su lugar, utilizan la estructura inherente de los datos para aprender y hacer predicciones. Una aplicación común del aprendizaje no supervisado es el agrupamiento, en el que el algoritmo agrupa los puntos de datos similares juntos. Otra es la reducción de dimensionalidad, en la que el algoritmo reduce el número de características en los datos mientras mantiene las relaciones importantes entre ellas.
- Los algoritmos de aprendizaje por refuerzo se utilizan para tomar decisiones en un entorno dinámico. El algoritmo aprende ejecutando acciones y recibiendo recompensas o sanciones en función del resultado de esas acciones. El objetivo es maximizar la recompensa global. El aprendizaje por refuerzo se ha utilizado para enseñar a robots a realizar tareas, y también se utiliza en algunos videojuegos para controlar las acciones de personajes no controlados por el jugador.
Hay algunas similitudes entre los diferentes tipos de algoritmos. Los tres tipos se pueden utilizar para hacer predicciones o decisiones basadas en datos, y todos requieren cierto entrenamiento. Sin embargo, la forma en que se entrenan y el tipo de salida que producen difieren. Los algoritmos supervisados utilizan datos de entrenamiento etiquetados y producen salida etiquetada, los algoritmos no supervisados no tienen datos de entrenamiento etiquetados y producen salida sin etiquetar, y los algoritmos de refuerzo aprenden a través de un proceso de ensayo y error y producen una secuencia de acciones.