Aanvullende NLP-analyse

Introductie tot Natural Language Processing in R

Kasey Jones

Research Data Scientist

BERT en ERNIE.

Wat is het:

  • BERT: Bidirectional Encoder Representations from Transformers
  • Een model voor transfer learning bij NLP-taken
  • is voorgetraind op ongelabelde data om een taalrepresentatie te maken
  • heeft maar weinig gelabelde data nodig om voor een specifieke taak te trainen

Waarvoor gebruik je het:

  • supervised taken
  • features maken voor NLP-modellen

ERNIE: Enhanced Representation through kNowledge IntEgration

Introductie tot Natural Language Processing in R

Named Entity Recognition

Wat is het:

  • classificeert benoemde entiteiten in tekst
  • Voorbeelden: namen, locaties, organisaties, waarden

Waarvoor gebruik je het:

  • entiteiten uit tweets halen
  • aanbevelingssystemen ondersteunen
  • zoekalgoritmen
Introductie tot Natural Language Processing in R

Woordsoorttagging

Wat is het:

  • woorden labelen met hun woordsoort
    • zelfstandige naamwoorden, werkwoorden, bijvoeglijke naamwoorden, enz.

Hoe gebruik je het:

  • helpt bij sentimentanalyse
  • maakt features voor NLP-modellen
  • verrijkt wat een model over elk woord weet
Introductie tot Natural Language Processing in R

Laten we het samenvatten.

Introductie tot Natural Language Processing in R

Preparing Video For Download...