Tekstclassificatie

Werken met Hugging Face

Jacob H. Marquez

Lead Data Engineer

Tekstclassificatie: Sentimentanalyse

$$

  • Labelt tekst op basis van emotionele toon

$$

Sentimentanalyse

$$

  • Toepassingen: Reviews analyseren, sentiment op social media volgen

Sentimentpictogram

Werken met Hugging Face

Sentimentanalyse: codevoorbeeld

from transformers import pipeline

my_pipeline = pipeline( "text-classification", model="distilbert-base-uncased-finetuned-sst-2-english" )
print(my_pipeline("Wi-Fi is slower than a snail today!"))
[{'label': 'NEGATIVE', 'score': 0.99}]
Werken met Hugging Face

Tekstclassificatie: Grammaticale correctheid

$$

Grammaticacontrole

$$

  • Beoordeelt tekst op grammaticale correctheid

$$

Voorbeeld van grammaticale correctheid

$$

  • Toepassingen: Spellings-/grammaticacontrole, taalleertools
Werken met Hugging Face

Grammaticale correctheid: codevoorbeeld

from transformers import pipeline


# Create a pipeline for grammar checking grammar_checker = pipeline( task="text-classification", model="abdulmatinomotoso/English_Grammar_Checker" )
# Check grammar of the input text print(grammar_checker("He eat pizza every day."))
[{'label': 'LABEL_0', 'score': 0.99}]
Werken met Hugging Face

Tekstclassificatie: QNLI

$$ Vragen en antwoorden

$$

$$

  • Checkt of een premisse een vraag beantwoordt

  • Toepassingen: Q&A-systemen, factchecking

Voorbeeld van QNLI

Werken met Hugging Face

QNLI: codevoorbeeld

from transformers import pipeline


classifier = pipeline( task="text-classification", model="cross-encoder/qnli-electra-base" )
classifier("Where is Seattle located?, Seattle is located in Washington state.")
[{'label': 'LABEL_0', 'score': 0.997}]
Werken met Hugging Face

Tekstclassificatie: Dynamische categorietoewijzing

$$

  • Wijst dynamisch categorieën toe op basis van inhoud

Voorbeeld categorietoewijzing

  • Toepassingen: Moderatie, aanbevelingssystemen

$$

Categorietoewijzing

Werken met Hugging Face

Dynamische categorietoewijzing: codevoorbeeld

classifier = pipeline(
  task="zero-shot-classification", 
  model="facebook/bart-large-mnli")


text = "Hey, DataCamp; we would like to feature your courses in our newsletter!" categories = ["marketing", "sales", "support"]
output = classifier(text, categories)
print(f"Top Label: {output['labels'][0]} with score: {output['scores'][0]}")
Top Label: support with score: 0.8183
Werken met Hugging Face

Uitdagingen van tekstclassificatie

Dubbelzinnigheid

Werken met Hugging Face

Uitdagingen van tekstclassificatie

Sarcasme

Werken met Hugging Face

Uitdagingen van tekstclassificatie

Meertalig

Werken met Hugging Face

Laten we oefenen!

Werken met Hugging Face

Preparing Video For Download...