Yüksek kaliteli geri bildirim toplama yöntemleri

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

Mina Parham

AI Engineer

Yüksek kaliteli geri bildirim toplama yöntemleri

Ödül modeli olmadan RLHF süreci.

Yüksek kaliteli geri bildirim toplama yöntemleri

Tam RLHF süreci.

Çiftli karşılaştırmalar

İki seçenek arasında seçim:
Avantajlar: Basit, sezgisel, önyargıyı azaltır
Zorluklar: Etiket başına daha az bilgi sağlar
Örnek: Film A vs. Film B: "Hangisini tercih edersiniz?

Elinde “Kabul” ve “Reddedildi” simgeleri olan iki tabela tutan bir kişi.

Çiftli karşılaştırmalar

def evaluate_responses(responses_A, responses_B):
    wins_A, wins_B = 0, 0
    for (response_A, score_A), (response_B, score_B) in zip(responses_A, responses_B):
        if score_A > score_B:
            wins_A += 1
        else:
            wins_B += 1
    success_rate_A = (wins_A / len(responses_A)) * 100
    success_rate_B = (wins_B / len(responses_B)) * 100
    return success_rate_A, success_rate_B

Puanlamalar

Bir ölçekte puan verme:
Avantajlar: Daha ayrıntılı geri bildirim sağlar
Zorluklar: Önyargılara açık, tutarsız ölçekler
Örnek:
```
  Film A: 4/5
  Film B: 3/5
```

Etrafında puanlama simgeleri olan bir yıldız tutan bir kadın illüstrasyonu.

Psikolojik etkenler

Bilişsel Önyargılar:
- Çerçeveleme Etkisi: Sorunun sunumu yanıtları etkileyebilir
- Sıra Konumu Etkisi: Seçeneklerin sunulma sırası kararları etkileyebilir
- Çapalama: Önceki bilgi mevcut kararları saptırır

Bir kişi gözleriyle kare görüp zihninde dikdörtgen olarak yorumluyor; önyargı kavramını betimliyor.

Yüksek kaliteli geri bildirim toplama yönergeleri

Bilişsel yük: yorgun kullanıcılar, tutarsız geri bildirim
Soruları dikkatle formüle edin
- Bilişsel yükten kaynaklı riskleri azaltmak için.
Soru sırasını rastgeleleştirin
- Çapalama ve çerçeveleme önyargısını azaltmak için
Çeşitli veri toplayın
- Gürültü sorununu azaltmak için.

Geri bildirim ve metinleri analiz eden bir erkek ve bir kadın resmi.

Hadi pratik yapalım!

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)