Sviluppare modelli di Machine Learning per la produzione
Sinan Ozdemir
Data Scientist, Entrepreneur, and Author
Consente di definire processi per valutare la qualità dei dati.
Offre anche altri vantaggi:

Una struttura che descrive l’organizzazione dei dati.
Per uno schema di database relazionale:
| Chiave database | Tipo di dato | Ordine dei dati |
|---|---|---|
Person.name |
string |
nominale |
Person.survey_score |
integer |
ordinale |

Documentare come abbiamo etichettato la variabile risposta migliora:
La riproducibilità della pipeline di training.
L’affidabilità del modello grazie alla qualità delle etichette.
Le prestazioni del modello migliorando le etichette.

I metodi di etichettatura possono evolvere nel tempo.
Una rappresentazione visiva delle fasi per creare il tuo modello di machine learning.
Include spesso:
Documentare l’esperimentazione e la selezione del miglior modello include:

Per documentare l’ambiente di training, includi:
scikit-learn==1.1.3).Perché?
Sviluppare modelli di Machine Learning per la produzione