Classificazione del testo

Lavorare con Hugging Face

Jacob H. Marquez

Lead Data Engineer

Classificazione del testo: analisi del sentiment

Etichetta il testo in base al tono emotivo

Analisi del sentiment

Applicazioni: analisi recensioni, monitoraggio sentiment social

Icona sentiment

Analisi del sentiment: esempio di codice

from transformers import pipeline


my_pipeline = pipeline(
    "text-classification",
    model="distilbert-base-uncased-finetuned-sst-2-english"
)

print(my_pipeline("Wi-Fi is slower than a snail today!"))

[{'label': 'NEGATIVE', 'score': 0.99}]

Classificazione del testo: correttezza grammaticale

Controllo grammaticale

Valuta la correttezza grammaticale del testo

Esempio di correttezza grammaticale

Applicazioni: correttori grammaticali, strumenti per l'apprendimento linguistico

Correttezza grammaticale: esempio di codice

from transformers import pipeline


# Create a pipeline for grammar checking
grammar_checker = pipeline(
    task="text-classification",
    model="abdulmatinomotoso/English_Grammar_Checker"
)

# Check grammar of the input text
print(grammar_checker("He eat pizza every day."))

[{'label': 'LABEL_0', 'score': 0.99}]

Classificazione del testo: QNLI

$$ Domande e risposte

Verifica se una premessa risponde a una domanda
Applicazioni: sistemi Q&A, fact-checking

Esempio di QNLI

QNLI: esempio di codice

from transformers import pipeline


classifier = pipeline(
    task="text-classification",
    model="cross-encoder/qnli-electra-base"
)


classifier("Where is Seattle located?, Seattle is located in Washington state.")

[{'label': 'LABEL_0', 'score': 0.997}]

Classificazione del testo: assegnazione dinamica di categorie

Assegna categorie dinamiche in base al contenuto

Esempio di assegnazione categoria

Applicazioni: moderazione contenuti, sistemi di raccomandazione

Assegnazione categorie

Assegnazione dinamica di categorie: esempio di codice

classifier = pipeline(
  task="zero-shot-classification", 
  model="facebook/bart-large-mnli")


text = "Hey, DataCamp; we would like to feature your courses in our newsletter!"
categories = ["marketing", "sales", "support"]


output = classifier(text, categories)


print(f"Top Label: {output['labels'][0]} with score: {output['scores'][0]}")

Top Label: support with score: 0.8183

Sfide della classificazione del testo

Ambiguità

Sfide della classificazione del testo

Sarcasmo

Sfide della classificazione del testo

Multilingue

Passiamo alla pratica!

Lavorare con Hugging Face