Introducción al Procesamiento de Lenguaje Natural

Introducción al Procesamiento de Lenguaje Natural
Duración
10-20 horas

El Procesamiento de Lenguaje Natural o Natural Language Processing (NLP) es un área de investigación dentro del campo de la Inteligencia Artificial que tiene objetivos que involucran tareas que van desde la conversión de voz en texto, hasta su procesamiento y la generación de voz a partir de éste. Las aplicaciones de este tipo de análisis son numerosas: clasificación de textos, análisis de sentimiento o generación de resúmenes automáticos, por citar algunas.

En este curso -y utilizando el lenguaje de programación Python- revisaremos las técnicas de tratamiento de textos previo al análisis, los principales métodos de vectorización de textos y aplicaremos la metodología de análisis a cinco fascinantes y prácticas áreas.

Para la asistencia a este curso los asistentes deberán conocer el lenguaje de programación Python y tener, al menos, conocimientos básicos de Machine Learning.

Contenido:

  • Introducción al NLP
  • Strings en Python
  • Expresiones regulares
  • Preprocesamiento de texto
  • Ingeniería de características
    • Bag of Words
    • Tf-Idf
    • Word2Vec
  • Clasificación de documentos
  • Análisis de sentimiento
    • Análisis supervisado de sentimiento
    • Análisis no supervisado de sentimiento
  • Similitud de textos
    • Distancias
    • Recomendadores
  • Resumen de textos
    • Extracción de términos clave
    • Topic modeling
    • Topic modeling con LSA
    • Topic modeling con NMF
    • Resumen de textos
  • Clustering de documentos