ChatGPT intermedio
Alex Banks
Founder & Educator








Grandes cantidades de datos web de baja calidad

Pocas cantidades de datos conversacionales de alta calidad

RLHF = Aprendizaje por refuerzo con retroalimentación humana


El etiquetado es una colaboración humano-máquina

ChatGPT intermedio