Workflow du machine learning

Comprendre le machine learning

Lis Sulmont

Curriculum Manager, DataCamp

Workflow du machine learning

Comprendre le machine learning

Notre scénario

New York City

Notre ensemble de données : Ventes de propriétés à New York de 2015 à 2019

Comprend :

  • Surface
  • Quartier
  • Année de construction
  • Prix de vente
  • et plus encore !

Notre cible : Prix de vente

Comprendre le machine learning

Étape 1 : Extraire des caractéristiques

Comprendre le machine learning

Étape 2 : Diviser l’ensemble de données

Comprendre le machine learning

Étape 3 : Entraîner le modèle

Comprendre le machine learning

Étape 3 : Entraîner le modèle

$$

Comprendre le machine learning

Étape 4 : Évaluer

Comprendre le machine learning

Étape 4 : Évaluer

Étape évaluer

  • Ensemble de données de test : données « non vues »
  • Il y a de nombreuses façons d'évaluer :
    • Quelle est l'erreur moyenne des prédictions ?
    • Quel pourcentage d'appartements le modèle a-t-il prédit avec une marge de précision de 10 % ?
Comprendre le machine learning

Étape 4 : Évaluer

Comprendre le machine learning

Étape 4 : Évaluer

Comprendre le machine learning

Étape 4 : Évaluer

  • Si ce n'est pas le cas, affinez les réglages du modèle et entraînez-le à nouveau :
    • par exemple, modifiez les options du modèle, ajoutez/supprimez des caractéristiques
Comprendre le machine learning

Workflow du machine learning

Comprendre le machine learning

Résumé des étapes

  1. Extraire des caractéristiques
    • Choix des caractéristiques et manipulation de l'ensemble des données
  2. Diviser l’ensemble de données
    • Ensemble de données d’entraînement et de test
  3. Entraîner le modèle
    • Entrée d'un ensemble de données d’entraînement dans un modèle de machine learning
  4. Évaluer
    • Si la performance obtenue n’est pas celle souhaitée : affinez les réglages du modèle et répétez l'étape 3.
Comprendre le machine learning

Passons à la pratique !

Comprendre le machine learning

Preparing Video For Download...