ChatGPT für Fortgeschrittene
Alex Banks
Founder & Educator
Viele Internetdaten minderer Qualität
Wenig Gesprächsdaten hoher Qualität
RLHF = Reinforcement Learning from Human Feedback
Beim Labeln arbeiten Mensch und Maschine eng zusammen.
ChatGPT für Fortgeschrittene