Algoritmos semisupervisados

Los algoritmos semisupervisados son un tipo de algoritmos de aprendizaje automático que utilizan tanto datos etiquetados como no etiquetados para realizar la tarea de aprendizaje.

En estos algoritmos, los datos etiquetados se utilizan para identificar patrones específicos y posteriormente estos patrones se aplican a los datos no etiquetados para inferir las etiquetas correspondientes. Esto permite a los algoritmos semisupervisados trabajar con conjuntos de datos grandes y complejos, en los cuales etiquetar cada muestra podría ser demasiado costoso o requerir mucho tiempo.

Un ejemplo típico es el de la identificación de personas en fotografías: podemos subir a, por ejemplo, Google Fotos, un conjunto de fotografías en las que aparecemos con familiares o amigos. El algoritmo de identificación semisupervisado -comparando los rostros - podría reconocer que cierta persona aparece en varias fotografías, de forma que basta que nosotros identifiquemos (etiquetemos) alguna de esas apariciones ("mi tío Lucas"), para que el algoritmo sea capaz de etiquetar como "Lucas" a mi tío en todas las fotografías en las que aparezca.

La mayor parte de los algoritmos semisupervisados están formados por combinaciones de algoritmos supervisados y no supervisados. Un buen ejemplo son las llamadas Deep Belief Networks (DBN) -llamadas Redes de Creencia Profunda en español-, redes neuronales profundas compuestas de redes simples denominadas Restricted Boltzmann Machines (RBS) que se entrenan de modo no supervisado de manera secuencial, siendo el conjunto posteriormente entrenado de forma supervisada.