Mengurangi bias dalam pengumpulan data

Menaklukkan Bias Data

Konstantinos Kattidis

Data Analytics Lead

Mengidentifikasi bias dalam pengumpulan data

  • Bias seleksi, bias historis, dan bias pengukuran
  • Memahami bias ini membangun kesadaran, sehingga pakar data dapat mengidentifikasi dan menindaklanjutinya secara proaktif

Perbandingan antara dua analisis

  • Analisis sensitivitas mengeksplorasi bagaimana asumsi berbeda, subkelompok alternatif, atau strategi pembobotan memengaruhi hasil analisis
  • Validasi eksternal membandingkan data dengan sumber independen untuk memeriksa konsistensi dan akurasi
Menaklukkan Bias Data

Sampling acak dan berstrata

Diagram tentang sampling acak dan berstrata

  • Memilih teknik sampling yang tepat itu penting
  • Sampling acak memilih individu atau titik data dari populasi secara acak
  • Sampling berstrata membagi populasi ke subkelompok lalu mengambil sampel dari tiap subkelompok
Menaklukkan Bias Data

Menyeimbangkan representasi subkelompok

Diagram menunjukkan undersampling dan oversampling

  • Oversampling menambah representasi kelompok/kelas tertentu untuk menyeimbangkan distribusi
  • Undersampling mengurangi representasi kelompok yang berlebih agar dataset lebih seimbang
  • Pembobotan memberi bobot berbeda pada observasi sesuai pentingnya, untuk mengompensasi ketidakseimbangan sampel
Menaklukkan Bias Data

Augmentasi data

  • Untuk mengatasi bias historis, teknik ini memperkaya dataset dengan titik data tambahan
  • Tujuannya mencakup periode atau peristiwa yang kurang terwakili
  • Mencakup:
    • Mengisi celah data
    • Mendurukan perspektif
    • Memperbarui dan mengoreksi kesalahan

Puzzle mengisi celah

Menaklukkan Bias Data

Praktik pengukuran data

Empat praktik pengukuran data

  • Standardisasi alat dan protokol pengukuran
  • Pelatihan dan kalibrasi pengumpul data
  • Uji coba (pilot) untuk menilai akurasi dan konsistensi prosedur pengumpulan data
  • Pemeriksaan mutu rutin dan otomasi proses untuk meningkatkan kualitas data
Menaklukkan Bias Data

Pemantauan dan penyesuaian berkelanjutan

Dasbor pemantauan data

  • Pemantauan dan penyesuaian berkelanjutan penting untuk mengatasi bias baru
  • Tinjauan rutin metrik kualitas data
  • Penilaian bias
  • Memungkinkan identifikasi bias secara cepat
Menaklukkan Bias Data

Ayo berlatih!

Menaklukkan Bias Data

Preparing Video For Download...