Scrivere codice ML manutenibile

Sviluppare modelli di Machine Learning per la produzione

Sinan Ozdemir

Data Scientist, Entrepreneur, and Author

Strutturare il progetto

  • Organizza i file del progetto con una struttura logica
  • Raggruppa i file correlati
    • Tieni dataset e modelli ML in cartelle separate
  • Dai nomi chiari e coerenti ai file

struttura

Sviluppare modelli di Machine Learning per la produzione

Esempio di struttura progetto

Esempio di directory di progetto con un file README, un file requirements e tre sottocartelle: data, models, notebooks mlops_directory

  • README.md: spiega scopo del repository e come usarlo.
  • requirements.txt: elenca tutte le dipendenze
  • data: contiene file dei dati, grezzi e processati
  • models: contiene i file dei modelli, inclusi gli script per crearli
  • notebooks: contiene notebook per esplorazione dati, training e valutazione modelli
Sviluppare modelli di Machine Learning per la produzione

Versionamento del codice

  • Usa un sistema di versionamento come git per tracciare le modifiche al codice
  • Permette di fare rollback se serve
  • Aiuta a identificare l’origine di bug ed errori
  • Consente lavoro in parallelo

codice

Sviluppare modelli di Machine Learning per la produzione

Documentazione

  • Documenta codice e struttura del progetto
  • Spiega lo scopo di ogni file e funzione
  • Descrivi come usare il codice
  • Includi istruzioni su come deployare il modello ML

doc

Sviluppare modelli di Machine Learning per la produzione

Adattabilità del codice

  • Più facile da capire, modificare e aggiornare
  • Riduce tempo e sforzo per fare cambiamenti nel codebase
  • Si adatta meglio a cambi di dati + codice + requisiti
  • Meno soggetto a bug
  • Più semplice integrare nuove feature o tecnologie
  • Essenziale per creare app ML che evolvono nel tempo
Sviluppare modelli di Machine Learning per la produzione

Passons à la pratique !

Sviluppare modelli di Machine Learning per la produzione

Preparing Video For Download...