Procesamiento del lenguaje natural

Understanding Machine Learning

Sara Billen

Curriculum Manager at DataCamp

Procesamiento del lenguaje natural (PLN)

La capacidad de los ordenadores para comprender el significado del lenguaje humano

Understanding Machine Learning

Bolsa de palabras

Bolsa de palabras

Understanding Machine Learning

Bolsa de palabras

"U2 is a great band"

Palabra Recuento
U2 1
Queen 0
is 1
a 1
great 1
band 1

"Queen is a great band"

Palabra Recuento
U2 0
Queen 1
is 1
a 1
great 1
band 1
Understanding Machine Learning

Bolsa de palabras: n-gramas

"That book is not great"

Palabra Recuento
That 1
book 1
is 1
not 1
great 1

2-grama (bigrama)

Palabra Recuento
That book 1
book is 1
is not 1
not great 1
Understanding Machine Learning

Bolsa de palabras: limitaciones

  • El recuento de palabras no nos ayuda a considerar los sinónimos
  • Ejemplo: "azul"
    • "cielo"
    • "agua"
    • "cerúleo"
  • Quieres agrupar como un único atributo

azul

Understanding Machine Learning

Incrustación de palabras

Incrustación de palabras

  • Crea atributos que agrupen palabras similares
  • Los atributos tienen un significado matemático:

$$

king - man + woman = queen

Understanding Machine Learning

Traducción de idiomas

Traducción con red neuronal

Understanding Machine Learning

Aplicaciones

  • Traducción de idiomas
  • Chatbots
  • Asistentes personales
  • Análisis de sentimiento
  • ...

Hombre chateando con un chat bot en un smartphone

Understanding Machine Learning

Aprendizaje profundo

  • Dos tipos de problemas
    • Visión artificial
    • Procesamiento de lenguaje natural
  • ¿Por qué escoger el aprendizaje profundo?
    • Problemas complejos
    • Extracción automática de atributos
    • Muchos datos

Understanding Machine Learning

¡Vamos a practicar!

Understanding Machine Learning

Preparing Video For Download...