Onderhoudbare ML-code schrijven

Machine Learning-modellen ontwikkelen voor productie

Sinan Ozdemir

Data Scientist, Entrepreneur, and Author

Projectstructuur

  • Orden projectbestanden logisch
  • Groepeer gerelateerde bestanden
    • Bewaar datasets en ML-modellen in aparte mappen
  • Geef bestanden duidelijke, consistente namen

structuur

Machine Learning-modellen ontwikkelen voor productie

Voorbeeldprojectstructuur

Voorbeeldprojectmap met een README, requirements en drie submappen: data, models, notebooks mlops_directory

  • README.md: beschrijft doel en gebruik van de repo
  • requirements.txt: somt alle dependencies op
  • data: bevat databestanden, raw en processed
  • models: bevat alle modelbestanden, incl. scripts om modellen te maken
  • notebooks: bevat notebooks voor exploratie, training en evaluatie
Machine Learning-modellen ontwikkelen voor productie

Codeversiebeheer

  • Gebruik versiebeheer zoals git om wijzigingen te volgen
  • Maakt rollback mogelijk indien nodig
  • Helpt de bron van bugs en errors te vinden
  • Ondersteunt parallel werken

code

Machine Learning-modellen ontwikkelen voor productie

Documentatie

  • Documenteer code en projectstructuur
  • Leg het doel van elk bestand en elke functie uit
  • Beschrijf hoe je de code gebruikt
  • Voeg instructies toe voor het deployen van het ML-model

documentatie

Machine Learning-modellen ontwikkelen voor productie

Aanpasbaarheid van code

  • Makkelijker te begrijpen, wijzigen en updaten
  • Minder tijd en moeite om wijzigingen door te voeren
  • Past zich makkelijker aan bij veranderingen in data + code + requirements
  • Minder foutgevoelig
  • Nieuwe features of technologieën makkelijker te integreren
  • Essentieel voor ML-apps die mee moeten evolueren
Machine Learning-modellen ontwikkelen voor productie

Laten we oefenen!

Machine Learning-modellen ontwikkelen voor productie

Preparing Video For Download...