Menulis kode ML yang mudah dirawat

Mengembangkan Model Machine Learning untuk Produksi

Sinan Ozdemir

Data Scientist, Entrepreneur, and Author

Struktur proyek

  • Susun berkas proyek dengan struktur yang logis
  • Kelompokkan berkas terkait
    • Pisahkan dataset dan model ML di folder berbeda
  • Pastikan penamaan dan label berkas rapi

struktur

Mengembangkan Model Machine Learning untuk Produksi

Contoh struktur proyek

Contoh direktori proyek dengan README, file requirements, dan tiga subfolder: data, models, notebooks mlops_directory

  • README.md: Menjelaskan tujuan repositori dan cara menggunakannya.
  • requirements.txt: Daftar semua dependensi
  • data: berisi berkas terkait data, termasuk data mentah dan terolah
  • models: berisi semua berkas terkait model, termasuk skrip pembuatan model
  • notebooks: berisi notebook untuk eksplorasi data, pelatihan, dan evaluasi model
Mengembangkan Model Machine Learning untuk Produksi

Versi kode

  • Gunakan sistem kontrol versi seperti git untuk melacak perubahan kode
  • Memungkinkan rollback jika perlu
  • Membantu menemukan sumber bug dan error
  • Memungkinkan kerja paralel

kode

Mengembangkan Model Machine Learning untuk Produksi

Dokumentasi

  • Dokumentasikan kode dan struktur proyek
  • Jelaskan tujuan tiap berkas dan fungsi
  • Jelaskan cara menggunakan kode
  • Sertakan instruksi deploy model ML

dok

Mengembangkan Model Machine Learning untuk Produksi

Daya adaptasi kode

  • Lebih mudah dipahami, diubah, dan diperbarui
  • Mengurangi waktu dan upaya saat mengubah kode
  • Lebih mudah beradaptasi dengan perubahan data + kode + kebutuhan
  • Lebih kecil kemungkinan bug
  • Lebih mudah menambah fitur/teknologi baru sesuai kebutuhan
  • Penting untuk membangun aplikasi ML yang dapat berkembang seiring waktu
Mengembangkan Model Machine Learning untuk Produksi

Ayo berlatih!

Mengembangkan Model Machine Learning untuk Produksi

Preparing Video For Download...