Pengantar Continuous Integration/Continuous Delivery untuk Machine Learning

CI/CD untuk Machine Learning

Ravi Bhadauria

Machine Learning Engineer

Gambaran SDLC

  • SDLC: Software Development Life Cycle
  • Pendekatan sistematis yang mencakup pengembangan perangkat lunak dari awal hingga akhir
  • Alur kerja SDLC adalah urutan langkah untuk mencapai tujuan tertentu:
    • Build: mengompilasi/memaketkan kode, menyelesaikan dependensi
    • Test: memastikan fungsionalitas, kualitas, dan keandalan basis kode
    • Deploy: membuat perangkat lunak tersedia di lingkungan tertentu

  Plot dependensi langkah alur kerja SDLC. Build adalah langkah pertama, diikuti test dan deploy.

CI/CD untuk Machine Learning

SDLC dalam machine learning

  • Pengembangan machine learning bisa kompleks dan memakan waktu
    • Model adalah algoritme yang berevolusi dinamis
    • Rekayasa data itu penting
  • Continuous Integration/Continuous Delivery mengurangi kesalahan dan mempercepat rilis perangkat lunak ML berkualitas tinggi
  • Penting untuk efisiensi ML dan eksperimen
1 https://cloud.google.com/blog/products/ai-machine-learning/making-the-machine-the-machine-learning-lifecycle
CI/CD untuk Machine Learning

Apa itu CI/CD?

  • Continuous Integration (CI): Praktik sering membangun, menguji, dan menggabungkan perubahan kode ke repositori bersama
  • Memungkinkan developer mendeteksi masalah integrasi lebih awal dan menjaga basis kode tetap konsisten
  • Continuous Delivery (CD): Memastikan perubahan kode dapat diproduksikan kapan saja, tetapi memerlukan persetujuan manual
  • Continuous Deployment (CD): Secara otomatis menerapkan perubahan kode ke produksi tanpa intervensi manual
CI/CD untuk Machine Learning

CI/CD dalam machine learning

  • Ketergantungan Data: Strategi versi data dan pengelolaan
  • Eksperimen: Otomatisasi penalaan hiperparameter
  • Versi Model: Meningkatkan kolaborasi
  • Paradigma Pengujian: Melampaui uji fungsional dan unit tradisional
  • Tantangan Penerapan Berkelanjutan: Kompleksitas penyajian model, pemantauan, dan pembaruan
CI/CD untuk Machine Learning

Cakupan kursus ini

Plot langkah proyek machine learning, menekankan Persiapan Data, Pengembangan Model, serta Evaluasi dan Penalaan Model.

CI/CD untuk Machine Learning

Ringkasan

  • Alur kerja Software Development Life Cycle mencakup build, test, dan deploy kode
  • Continuous Integration (CI) memastikan penggabungan kode yang sering dan deteksi dini masalah
  • Continuous Delivery (CD) memungkinkan perubahan kode diproduksikan dengan persetujuan manual
  • Continuous Deployment (CD) mengotomatiskan penerapan kode tanpa intervensi manual
  • CI/CD dalam Machine Learning memfasilitasi
    • Versi data
    • Pembangunan dan versi model
    • Otomatisasi eksperimen
    • Pengujian
    • Penerapan
CI/CD untuk Machine Learning

Ayo berlatih!

CI/CD untuk Machine Learning

Preparing Video For Download...