Mitigasi bias

Manajemen Data AI yang Bertanggung Jawab

Maria Prokofieva

Lead ML engineer

Yang akan dibahas

  • Strategi di seluruh siklus proyek
  • Pengambilan sampel ulang dan pembobotan ulang
  • Pelabelan ulang dan penghapusan atribut sensitif
  • Pelatihan adversarial dan kalibrasi ulang model
  • Perilaku pengguna
  • Kendala keadilan dan pemilihan algoritme
  • Ada strategi lain
Manajemen Data AI yang Bertanggung Jawab

Bias: ulasan kembali

  • Kesalahan sistematis atau prasangka
  • Hasil tidak adil bagi kelompok atau individu

Bias dalam AI

1 Gambar oleh Streamline HQ
Manajemen Data AI yang Bertanggung Jawab

Bias di seluruh proyek

  • Dalam data mentah
  • Dalam pra-pemrosesan
  • Dalam pemodelan
  • Setelah deployment

siklus hidup

Manajemen Data AI yang Bertanggung Jawab

Bias di pra-pemrosesan

  • Pengambilan sampel ulang
  • Pembobotan ulang
  • Pelabelan ulang
  • Penghapusan atribut sensitif
Manajemen Data AI yang Bertanggung Jawab

Strategi di pra-pemrosesan

  • Pengambilan sampel ulang:
    • Sesuaikan distribusi agar kelas seimbang
  • Pembobotan ulang:
    • Koreksi bias dengan bobot kelas, ukuran data tetap
  • Pelabelan ulang:
    • Perbarui label agar target akurat
  • Penghapusan atribut sensitif:
    • Hilangkan atribut terlindungi
Manajemen Data AI yang Bertanggung Jawab

Bias dalam pemodelan

  • Bias dari algoritme
  • Pelatihan adversarial
  • Kendala keadilan
  • Pemilihan algoritme: model lebih sederhana, tangguh, atau dapat digeneralisasi
Manajemen Data AI yang Bertanggung Jawab

Penasihat keuangan

  • Bias terkait kesenjangan ekonomi regional
  • Pelatihan adversarial untuk mengoreksi bias
  • Pohon keputusan dan model linear teratur

penasihat keuangan

1 Gambar oleh Streamline HQ
Manajemen Data AI yang Bertanggung Jawab

Bias pasca-deploy dan penggunaan

  • Pantau bias untuk mencegah drift model
  • Kalibrasi ulang model
  • Penggunaan aplikasi yang tidak tepat

aplikasi digunakan

1 Gambar oleh Streamline HQ
Manajemen Data AI yang Bertanggung Jawab

Penasihat keuangan

Drift model:

  • Ekonomi pekerja lepas kurang terwakili

Penggunaan yang keliru:

  • Memperbarui informasi keuangan

penasihat keuangan

1 Gambar oleh Streamline HQ
Manajemen Data AI yang Bertanggung Jawab

Ayo berlatih!

Manajemen Data AI yang Bertanggung Jawab

Preparing Video For Download...