Machine learning met scikit-learn

Supervised Learning met scikit-learn

George Boorman

Core Curriculum Manager, DataCamp

Wat is machine learning?

  • Machine learning is het proces waarbij:
    • Computers leren beslissen op basis van data
    • zonder expliciet geprogrammeerd te zijn!
Supervised Learning met scikit-learn

Voorbeelden van machine learning

e-mailpictogram

boeken

Supervised Learning met scikit-learn

Unsupervised learning

  • Verborgen patronen vinden in ongetagde data

  • Voorbeeld:

    • Klanten groeperen in categorieën (clustering)

clusteranalyse

Supervised Learning met scikit-learn

Supervised learning

  • De doelwaarden zijn bekend

  • Doel: De doelwaarden van nieuwe data voorspellen op basis van features

 

features en doelvariabelen

Supervised Learning met scikit-learn

Types supervised learning

  • Classificatie: Doelvariabele bestaat uit categorieën

geldautomaat

  • Regressie: Doelvariabele is continu

 

woningen

Supervised Learning met scikit-learn

Naamgevingsconventies

  • Feature = voorspeller = onafhankelijke variabele

  • Doelvariabele = afhankelijke variabele = responsvariabele

 

features en doelvariabelen

Supervised Learning met scikit-learn

Voor je supervised learning gebruikt

  • Vereisten:
    • Geen missende waarden
    • Numerieke data
    • Data in een pandas DataFrame of NumPy-array

 

  • Doe eerst Exploratory Data Analysis (EDA)
Supervised Learning met scikit-learn

scikit-learn-syntax

from sklearn.module import Model

model = Model()
model.fit(X, y)
predictions = model.predict(X_new)
print(predictions)
array([0, 0, 0, 0, 1, 0])
Supervised Learning met scikit-learn

Laten we oefenen!

Supervised Learning met scikit-learn

Preparing Video For Download...