Reproduksibilitas dan referensi

Konsep Komunikasi Data

Hadrien Lacroix

Curriculum Manager

Laporan tertulis

 

Laporan harus jelas dan reproducible.

Konsep Komunikasi Data

Contoh reproduksibilitas

 

  • Membuat kue

    • Resep
    • Bahan mentah
    • Oven dan alat ukur dapur kita
    • Kue dengan rasa serupa
  • Proyek data

    • Jalankan analisis lagi - hasil sama

 

ikon resep memasak

Konsep Komunikasi Data

Contoh replikabilitas

  • Membuat kue
    • Peralatan sendiri
    • Bahan sendiri
  • Proyek data
    • Lingkungan berbeda
Konsep Komunikasi Data

Keutamaan reproduksibilitas dan replikabilitas

 

  • Mencegah duplikasi upaya
  • Membangun di atas karya yang ada
  • Fokus pada tantangan baru
  • Telaah sejawat
  • Agnostik alat
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dibuat
    • Skrip terdokumentasi baik
      • Komentar dalam kode
    • Daftar paket dan lingkungan yang dipakai
    • Version control
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dibuat
  2. Hindari manipulasi data manual
    • Versioning data
    • Simpan data mentah dan langkah antara
    • Adaptasi dan selesaikan masalah
    • Contoh: imputasi data
      • imput nilai hilang dengan mean
      • simpan dan tutup editor
      • bagaimana tahu nilai mana yang awalnya diganti?
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dibuat
  2. Hindari manipulasi data manual
  3. Kendalikan keacakan
    • Random seed untuk pipeline ML
    • Mengendalikan variabel perancu
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dibuat
  2. Hindari manipulasi data manual
  3. Dokumentasikan keacakan
  4. Keterjelasan (interpretability)
    • Pahami penyebab keputusan atau prediksi model
    • Kisah dengan narasi yang kuat
    • Terkait dengan reproduksibilitas
1 Molnar C. Interpretable Machine Learning. 2019.
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dibuat
  2. Hindari manipulasi data manual
  3. Dokumentasikan keacakan
  4. Keterjelasan (interpretability)
  5. Sitasi pustaka dengan benar
Konsep Komunikasi Data

Referensi

 

  • Sitasi adalah info dasar untuk mengidentifikasi dan menemukan publikasi tertentu
Konsep Komunikasi Data

Referensi

 

  • Gaya berbeda, logika dasar sama
    • Buku: Nama Penulis (Tahun). Judul. Penerbit.
    • Artikel Jurnal: Nama Penulis. (Tahun) 'Judul Artikel.' Nama Jurnal, Nomor Volume, Nomor Edisi, Halaman.
    • Situs web: Nama Penulis. Tanggal Terbit, 'Judul Halaman/Karya.' Nama Situs, Lokasi

 

  • Gaya APA:
    • Sitasi dalam teks (penulis, tahun)
Konsep Komunikasi Data

Referensi

  • Alat manajemen referensi
    • Lebih mudah melacak
    • Ganti antar gaya
    • Cari referensi online
    • Opsi:
      • EndNote
      • Mendeley
      • RefWorks
Konsep Komunikasi Data

Referensi

  • Konteks bisnis
    • Kurang ketat
    • Lebih sederhana (tautan)
    • ==> informasi tersedia dan dapat diambil
Konsep Komunikasi Data

Ayo berlatih!

Konsep Komunikasi Data

Preparing Video For Download...