Processamento de linguagem natural

Entendendo Machine Learning

Sara Billen

Curriculum Manager at DataCamp

Processamento de linguagem natural (NLP)

A capacidade dos computadores de entender o significado da linguagem humana

Entendendo Machine Learning

Saco de palavras

Saco de palavras

Entendendo Machine Learning

Saco de palavras

"U2 é uma ótima banda"

Palavra Contagem
U2 1
Queen 0
é 1
uma 1
muito bom 1
banda 1

"Queen é uma ótima banda"

Palavra Contagem
U2 0
Queen 1
não 1
uma 1
muito bom 1
banda 1
Entendendo Machine Learning

Saco de palavras: n-gramas

"Esse livro não é ótimo"

Palavra Contagem
Esse 1
livro 1
não 1
é 1
muito bom 1

2-grama (bi-grama)

Palavra Contagem
Esse livro 1
livro é 1
não é 1
não é muito bom 1
Entendendo Machine Learning

Saco de palavras: limitações

  • A contagem de palavras não ajuda a considerar sinônimos
  • Exemplo: azul
    • azul-celeste
    • aqua
    • cerúleo
  • Você deseja agrupar como um único atributo

azul

Entendendo Machine Learning

Vetores de palavras

Vetores de palavras

  • Criar atributos que agrupem palavras semelhantes
  • Os atributos têm um significado matemático:

$$

king - man + woman = queen

Entendendo Machine Learning

Tradução de idiomas

Tradução com rede neural

Entendendo Machine Learning

Aplicações

  • Tradução de idiomas
  • Chatbots
  • Assistentes pessoais
  • Análise de sentimento
  • ...

Homem conversando com um chatbot no smartphone

Entendendo Machine Learning

Aprendizado profundo

  • Dois tipos de problemas
    • Visão computacional
    • Processamento de linguagem natural
  • Por que aprendizado profundo?
    • Problemas complexos
    • Extração automática de atributos
    • Muitos dados

Entendendo Machine Learning

Vamos praticar!

Entendendo Machine Learning

Preparing Video For Download...