Los algoritmos no supervisados parten de un conjunto de datos sin etiquetar (es decir, datos para los que solo se conocen las características predictivas), sencillamente porque el objetivo final de estos algoritmos no es generar un modelo capaz de predecir etiquetas. Por el contrario, el objetivo de estos algoritmos es analizar el conjunto de datos de entrenamiento y extraer de él información relevante.
Un tipo de estos algoritmos son los llamados de clustering, algoritmos que tienen como finalidad agrupar los datos en bloques o clusters de elementos semejantes. Por ejemplo, podríamos dar al algoritmo de clustering información sobre nuestros clientes y el algoritmo los agruparía en bloques (en clusters) de clientes "parecidos", lo que nos permitiría, por ejemplo, aplicar diferentes políticas comerciales a cada uno de dichos grupos pues, probablemente, los clientes incluidos en cada uno de esos clusters tengan intereses y necesidades semejantes.
Un segundo tipo de algoritmos no supervisados son los llamados de reducción de dimensionalidad, que parten de un conjunto de datos de n características predictivas (lo que puede ser interpretado como un conjunto de datos de n dimensiones) y lo transforma en un conjunto de menos características (de menor dimensionalidad), intentando minimizar la pérdida de información derivada de este proceso.
Estos algoritmos resultan también muy útiles cuando deseamos visualizar conjuntos de datos de más de tres dimensiones. Aun aceptando que puede producirse una cierta pérdida de información, el reducir el número de características predictivas a dos o a tres nos permite llevar los datos a gráficas en 2D o 3D para, por ejemplo, poder realizar un examen visual de ellos.
Otro tipo de algoritmos no supervisados son los llamados algoritmos de cesta de la compra, que nos permiten encontrar "asociaciones" entre nuestros datos: por ejemplo, qué artículos suelen comprarse al mismo tiempo (de ahí el nombre de "algoritmos de cesta de la compra", aunque pueden aplicarse también a otros escenarios). Una vez conocidas estas asociaciones (por ejemplo, “el producto B se adquiere un 48% de las veces que se adquiere el producto A”), los responsables de ventas pueden utilizar esta información para realizar recomendaciones, aplicar descuentos por la compra simultánea de estos productos para incentivar la venta del producto B (¡o subir el precio del producto B para mejorar los márgenes!), podrían situar estos productos próximos entre sí en los lineales para facilitar su compra, etc.
Podemos decir que los algoritmos no supervisados tienen como objetivo "describir" los datos siendo analizados.