Este tipo de algoritmos destacan por:
- Ser efectivos en espacios de alta dimensionalidad, aun cuando el número de dimensiones supera el número de muestras
 - Eficiente gestión de la memoria, al usar solo un subconjunto de puntos en la función de decisión
 
Las desventajas, por el contrario, incluyen las siguientes:
- Su eficacia depende del kernel que se escoja
 - Resultan poco eficientes con datasets grandes (el cálculo del kernel puede resultar muy lento)
 - Si el número de características es mucho mayor que el número de muestras, resulta crucial evitar el sobreentrenamiento escogiendo el kernel y el término de regularización adecuados
 - SVM no proporciona estimaciones de probabilidad
 - La frontera de decisión depende directamente de los valores más próximos, aunque sean erróneos
 - SVM es muy dependiente de la escala de los datos, por lo que convendrá escalarlos adecuadamente