Mode penyajian

Penyebaran dan Siklus Hidup MLOps

Nemanja Radojkovic

Senior Machine Learning Engineer

model sebagai perangkat lunak

Penyebaran dan Siklus Hidup MLOps

perspektif pengguna

Penyebaran dan Siklus Hidup MLOps

layanan seperti lainnya

Penyebaran dan Siklus Hidup MLOps

layanan makanan

Penyebaran dan Siklus Hidup MLOps

layanan model

Penyebaran dan Siklus Hidup MLOps

Serving dan mode serving

  • Layanan prediksi == Model serving
  • Implementasi jenis serving tertentu == Mode serving

 

Pilih dengan cermat!

Penyebaran dan Siklus Hidup MLOps

kapan layanan dijalankan

Penyebaran dan Siklus Hidup MLOps

terjadwal

Penyebaran dan Siklus Hidup MLOps

sesuai permintaan

Penyebaran dan Siklus Hidup MLOps

prediksi batch 1

Penyebaran dan Siklus Hidup MLOps

prediksi batch 2

Penyebaran dan Siklus Hidup MLOps

definisi batch

Penyebaran dan Siklus Hidup MLOps

juga dikenal sebagai

Penyebaran dan Siklus Hidup MLOps

Prediksi batch: tetap sederhana

  • Prediksi batch paling sederhana
  • Jika use case memungkinkan, pilih ini
  • Cocok: pembuatan ramalan penjualan bulanan
Penyebaran dan Siklus Hidup MLOps

prediksi on-demand 1

Penyebaran dan Siklus Hidup MLOps

sinonim on-demand

Penyebaran dan Siklus Hidup MLOps

pentingnya waktu on-demand

Penyebaran dan Siklus Hidup MLOps

istilah teknis

Penyebaran dan Siklus Hidup MLOps

waktu permintaan

Penyebaran dan Siklus Hidup MLOps

waktu respons

Penyebaran dan Siklus Hidup MLOps

Latensi yang dapat diterima

Apa yang dapat diterima?

  • < 1 jam?
  • < 1 menit?
  • < 1 detik?
  • < 1 milidetik?
Penyebaran dan Siklus Hidup MLOps

Prediksi near real-time alias stream processing

Latensi yang dapat diterima ~= X menit

Juga disebut stream processing (permintaan dan respons membentuk "aliran data")

Penyebaran dan Siklus Hidup MLOps

Prediksi real-time

Latensi yang dapat diterima < 1 dtk

Contoh:

  • Deteksi penipuan kartu kredit
  • Prediksi terlambat hampir tidak berguna
Penyebaran dan Siklus Hidup MLOps

Saat latensi jadi prioritas

  • Model lebih lemah tapi lebih cepat bisa lebih bernilai daripada yang lebih kuat tapi lebih lambat
  • Model ditempatkan di perangkat pengguna akhir untuk menurunkan latensi => "edge deployment"
    • Aplikasi ponsel berkemampuan ML:
      • aplikasi navigasi
      • buka kunci dengan pengenalan wajah
      • filter gambar
Penyebaran dan Siklus Hidup MLOps

Ayo berlatih!

Penyebaran dan Siklus Hidup MLOps

Preparing Video For Download...