Machine learning avec scikit-learn

Apprentissage supervisé avec scikit-learn

George Boorman

Core Curriculum Manager, DataCamp

Qu’est-ce que le machine learning ?

  • Le machine learning est le processus par lequel :
    • Les ordinateurs apprennent à prendre des décisions à partir de données
    • sans être explicitement programmés
Apprentissage supervisé avec scikit-learn

Exemples de machine learning

icone d’e-mail

livres

Apprentissage supervisé avec scikit-learn

Apprentissage non supervisé

  • Découvrir des modèles cachés à partir de données non étiquetées

  • Exemple :

    • Regrouper des clients en catégories distinctes (clustering)

analyse en clusters

Apprentissage supervisé avec scikit-learn

Apprentissage supervisé

  • Les valeurs prédites sont connues

  • Objectif : Prédire les valeurs cibles de nouvelles données, compte tenu des caractéristiques

 

caractéristiques et variables cibles

Apprentissage supervisé avec scikit-learn

Types d’apprentissage supervisé

  • Classification : la variable cible se compose de catégories

atm

  • Régression : la variable cible est continue

 

propriétés

Apprentissage supervisé avec scikit-learn

Conventions de dénomination

  • Caractéristique = variable prédictive = variable indépendante

  • Variable cible = variable dépendante = variable de réponse

 

caractéristiques et variables cibles

Apprentissage supervisé avec scikit-learn

Avant d’utiliser l’apprentissage supervisé

  • Exigences :
    • Pas de valeurs manquantes
    • Données au format numérique
    • Données stockées dans un DataFrame pandas ou un tableau NumPy

 

  • Effectuer en premier une analyse exploratoire des données (AED)
Apprentissage supervisé avec scikit-learn

Syntaxe scikit-learn

from sklearn.module import Model

model = Model()
model.fit(X, y)
predictions = model.predict(X_new)
print(predictions)
array([0, 0, 0, 0, 1, 0])
Apprentissage supervisé avec scikit-learn

Passons à la pratique !

Apprentissage supervisé avec scikit-learn

Preparing Video For Download...