Menutup perjalanan RLHF Anda

Reinforcement Learning from Human Feedback (RLHF)

Mina Parham

AI Engineer

Memulai dengan konsep dasar

Ilustrasi manusia di dunia bertenaga AI.

Seseorang memegang dua papan: satu dengan ikon 'Diterima' dan satu dengan ikon 'Ditolak'.

Ilustrasi seseorang mengendarai sepeda empat kursi dengan tiga robot, melambangkan kolaborasi manusia–mesin.

Ikon empat rekan dengan kaca pembesar melihat metrik di layar besar, mewakili evaluasi model.

Reinforcement Learning from Human Feedback (RLHF)