Konzepte großer Sprachmodelle (LLMs)
Vidhi Chugh
AI strategist and ethicist
Mit generativem Pre-Training trainiert
Eingabe
Der schnelle Braune
Der schnelle braune Fuchs
Der schnelle braune Fuchs springt
Der schnelle braune Fuchs springt über
Der schnelle braune Fuchs springt über den
Der schnelle braune Fuchs springt über den faulen
Der schnelle braune Fuchs springt über den faulen Hund
Ausgabe
Fuchs
springt
über
den
faulen
Hund
Verbirgt ein bestimmtes Wort
Das trainierte Modell sagt das maskierte Wort voraus
Originaltext: „Der schnelle braune Fuchs springt über den faulen Hund.“
Maskierter Text: „Der schnelle [MASKIERT] Fuchs springt über den faulen Hund.“
Ziel: Vorhersage des fehlenden Worts
Basierend auf den Erkenntnissen aus den Trainingsdaten
Konzepte großer Sprachmodelle (LLMs)