Entraînement du modèle

Machine Learning de bout en bout

Joshua Stapleton

Machine Learning Engineer

Rasoir d’Occam

  • L’explication suffisante la plus simple est la meilleure
  • Privilégier des modèles simples lors du choix

Image d’exemple illustrant le principe du rasoir d’Occam

Machine Learning de bout en bout

Options de modélisation

Régression logistique

  • Trouve la frontière de décision entre classes
  • sklearn.linear_model.LogisticRegression

Classifieur à vecteurs de support

  • Trouve un plan séparant les classes
  • sklearn.svm.SVC

Arbre de décision

  • Trouve des « règles » simples pour classer
  • sklearn.tree.DecisionTreeClassifier

Forêt aléatoire

  • Combine plusieurs arbres de décision
  • sklearn.ensemble.RandomForestClassifier
Machine Learning de bout en bout

Autres modèles

Modèles de deep learning

  • Réseaux de neurones
  • Réseaux de neurones convolutifs
  • Generative Pretrained Transformer (GPT)

K plus proches voisins (KNN)

  • Algorithme d’apprentissage supervisé

XGBoost

Machine Learning de bout en bout

Principes d’entraînement

Modèle :

  • Utilise des données nettoyées et des features traitées
  • Apprend des motifs dans les données d’entraînement
  • Vise à prédire la cible du diagnostic de maladie cardiaque

Principes :

  • Le modèle doit généraliser à des données inédites (hors ensemble d’entraînement)
  • Mettre de côté des données (« hold-out ») pour tester après l’entraînement
  • Répartition entraînement/test généralement 70/30 ou 80/20
  • Peut utiliser sklearn.model_selection.train_test_split
Machine Learning de bout en bout

Entraîner un modèle

# Importing necessary libraries
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# Split the data into training and testing sets (80:20) X_train, X_test, y_train, y_test = train_test_split(features, heart_disease_y, test_size=0.2, random_state=42)
# Define the models logistic_model = LogisticRegression(max_iter=200)
# Train the model logistic_model.fit(X_train, y_train)
Machine Learning de bout en bout

Obtenir des prédictions

# Jane Doe's health data, for example: [age, cholesterol level, blood pressure, etc.]
jane_doe_data = [45, 230, 120, ...]

# Reshape the data to 2D, because scikit-learn expects a 2D array-like input jane_doe_data = jane_doe_data.reshape(1, -1)
# Use the model to predict Jane's heart disease diagnosis probabilities jane_doe_probabilities = logistic_model.predict_proba(jane_doe_data) jane_doe_prediction = logistic_model.predict(jane_doe_data)
Machine Learning de bout en bout

Obtenir des prédictions (suite)

# Print the probabilities
print(f"Jane Doe's predicted probabilities: {jane_doe_probabilities[0]}")
print(f"Jane Doe's predicted health condition: {jane_doe_prediction[0]}")
Probabilités prévues pour Jane Doe : [0.2 0.8]

État de santé prévu pour Jane Doe : 1
Machine Learning de bout en bout

Passons à la pratique !

Machine Learning de bout en bout

Preparing Video For Download...