Textklassifikation

Einführung in Generative KI in Snowflake

James Cha-Earley

Senior Developer Advocate, Snowflake

Herausforderungen der Textklassifikation

Das Problem

$$

  • Bewertungen können jede Information enthalten

$$

  • Manuelle Kategorisierung ist zeitaufwendig und nicht skalierbar

Die Lösung

$$

  • Automatisiere mit Snowflake Cortex!

$$

  • classify_text()
Einführung in Generative KI in Snowflake

Kategorien definieren

# Kategorien definieren
categories = ["overall_experience", "location", "staff", "food_beverages",
              "facilities"]
Einführung in Generative KI in Snowflake

Text klassifizieren

from snowflake.cortex import classify_text

category = classify_text( str_input="The check-in was smooth and the staff were very friendly.", categories=categories )
print(category)
{  
  "label": "staff"  
}
Einführung in Generative KI in Snowflake

Ausgaben in ein Wörterbuch umwandeln

print(type(category))
<class 'str'>
import json

category_dict = json.loads(category)
print(type(category_dict))
<class 'dict'>
Einführung in Generative KI in Snowflake

Workflow skalieren

  • Klassifikations-Pipeline zur Kategorisierung von Bewertungen für einen bestimmten Monat
# Python-Code
month = 5
-- SQL-Abfrage
SELECT *
FROM HOTELS.REVIEWS
WHERE EXTRACT(month FROM date) = '{{month}}'
Einführung in Generative KI in Snowflake

classify_text() anwenden

df = cell2.to_pandas()

def classification(text): result = classify_text( str_input=text, categories=labels ) result_dict = json.loads(result) return result_dict["label"]
Einführung in Generative KI in Snowflake

classify_text() anwenden

# Klassifikation auf DataFrame anwenden
df["category"] = reviews["DESCRIPTION"].apply(classification)

# Erste Zeile der vorhergesagten Kategorie ausgeben print(df["category"].head(1))
0    overall_experience  
Name: category, dtype: object
Einführung in Generative KI in Snowflake

Sentimentanalyse

  • Nur an der Bewertungssentiment interessiert

AI_SENTIMENT in einer SQL-Zelle

Einführung in Generative KI in Snowflake

Sentimentanalyse

AI_SENTIMENT - Sentiment extrahieren

$$

  • Verfügbare Sentiments: positive, negative, neutral, mixed und unknown
Einführung in Generative KI in Snowflake

Lass uns üben!

Einführung in Generative KI in Snowflake

Preparing Video For Download...