Este tipo de algoritmos destacan por:
- Ser efectivos en espacios de alta dimensionalidad, aun cuando el número de dimensiones supera el número de muestras
- Eficiente gestión de la memoria, al usar solo un subconjunto de puntos en la función de decisión
Las desventajas, por el contrario, incluyen las siguientes:
- Su eficacia depende del kernel que se escoja
- Resultan poco eficientes con datasets grandes (el cálculo del kernel puede resultar muy lento)
- Si el número de características es mucho mayor que el número de muestras, resulta crucial evitar el sobreentrenamiento escogiendo el kernel y el término de regularización adecuados
- SVM no proporciona estimaciones de probabilidad
- La frontera de decisión depende directamente de los valores más próximos, aunque sean erróneos
- SVM es muy dependiente de la escala de los datos, por lo que convendrá escalarlos adecuadamente