Reproduksibilitas dan referensi

Konsep Komunikasi Data

Hadrien Lacroix

Curriculum Manager

Laporan tertulis

 

Laporan harus jelas dan reproducible.

Konsep Komunikasi Data

Contoh reproduksibilitas

 

  • Membuat kue

    • Resep
    • Bahan mentah
    • Oven dan alat ukur dapur kita
    • Kue dengan rasa serupa
  • Proyek data

    • Jalankan analisis lagi - hasil sama

 

ikon resep memasak

Konsep Komunikasi Data

Contoh replikabilitas

  • Membuat kue
    • Peralatan sendiri
    • Bahan sendiri
  • Proyek data
    • Lingkungan berbeda
Konsep Komunikasi Data

Keutamaan reproduksibilitas dan replikabilitas

 

  • Mencegah duplikasi upaya
  • Membangun di atas karya sebelumnya
  • Fokus pada tantangan baru
  • Telaah sejawat
  • Agnostik alat
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dihasilkan
    • Skrip terdokumentasi baik
      • Komentar dalam kode
    • Daftar paket dan lingkungan yang dipakai
    • Version control
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dihasilkan
  2. Hindari manipulasi data manual
    • Versi data
    • Simpan data mentah dan langkah antara
    • Adaptasi dan atasi masalah
    • Contoh: imputasi data
      • imputasi nilai hilang dengan mean
      • simpan dan tutup editor
      • bagaimana tahu nilai mana yang diganti sejak awal?
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dihasilkan
  2. Hindari manipulasi data manual
  3. Kendalikan keacakan
    • Seed acak untuk pipeline ML
    • Kendalikan variabel pengganggu
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dihasilkan
  2. Hindari manipulasi data manual
  3. Dokumentasikan keacakan
  4. Interpretabilitas
    • Memahami penyebab keputusan atau memprediksi hasil model
    • Narasi yang meyakinkan
    • Kaitan dengan reproduksibilitas
1 Molnar C. Interpretable Machine Learning. 2019.
Konsep Komunikasi Data

Praktik terbaik

  1. Lacak cara hasil dihasilkan
  2. Hindari manipulasi data manual
  3. Dokumentasikan keacakan
  4. Interpretabilitas
  5. Sitasi pustaka dengan benar
Konsep Komunikasi Data

Referensi

 

  • Sitasi adalah informasi dasar untuk mengidentifikasi dan menemukan sebuah publikasi
Konsep Komunikasi Data

Referensi

 

  • Gaya berbeda tetapi logika dasarnya sama
    • Buku: Nama Penulis (Tahun). Judul. Penerbit.
    • Artikel Jurnal: Nama Penulis. (Tahun) 'Judul Artikel.' Nama Jurnal, Volume, Nomor, Halaman.
    • Situs web: Nama Penulis. Tanggal terbit, 'Judul Halaman/Karya.' Nama Situs, Lokasi

 

  • Gaya APA:
    • Sitasi dalam teks (penulis, tahun)
Konsep Komunikasi Data

Referensi

  • Alat manajemen referensi
    • Lebih mudah melacak
    • Ganti antar gaya
    • Cari referensi daring
    • Opsi:
      • EndNote
      • Mendeley
      • RefWorks
Konsep Komunikasi Data

Referensi

  • Konteks bisnis
    • Kurang ketat
    • Lebih sederhana (tautan)
    • ==> informasi tersedia dan dapat diakses
Konsep Komunikasi Data

Ayo berlatih!

Konsep Komunikasi Data

Preparing Video For Download...