Maschinelles Lernen mit scikit-learn

Überwachtes Lernen mit scikit-learn

George Boorman

Core Curriculum Manager, DataCamp

Definition: Maschinelles Lernen

  • Maschinelles Lernen ist ein Prozess, bei dem …
    • Computer lernen, anhand von Daten Entscheidungen zu treffen,
    • ohne explizit dafür programmiert zu werden.
Überwachtes Lernen mit scikit-learn

Beispiele für maschinelles Lernen

E-Mail-Symbol auf einem Smartphone-Display

Bücherregal

Überwachtes Lernen mit scikit-learn

Unüberwachtes Lernen

  • Erkennung verborgener Muster in unbeschrifteten Daten

  • Beispiel:

    • Einteilung von Kunden in verschiedene Segmente (Clustering)

Beispiel einer Clusteranalyse

Überwachtes Lernen mit scikit-learn

Überwachtes Lernen

  • Vorherzusagende Variablen sind bereits bekannt

  • Ziel: Vorhersage der Werte für bisher noch nicht gesehene Daten anhand ihrer Merkmale

 

Beispieltabelle mit Merkmalen und Zielvariablen

Überwachtes Lernen mit scikit-learn

Arten des überwachten Lernens

  • Klassifikation: Zielvariable umfasst abgrenzbare Kategorien

Bild eines Geldautomaten

  • Regression: Zielvariable umfasst kontinuierliche Werte

 

Bild einer Häuserreihe

Überwachtes Lernen mit scikit-learn

Übliche Bezeichnungen

  • Merkmal = Prädiktorvariable = unabhängige Variable

  • Zielvariable = Antwortvariable = abhängige Variable

 

Beispieltabelle mit Merkmalen und Zielvariablen

Überwachtes Lernen mit scikit-learn

Vor dem überwachten Lernen

  • Voraussetzungen:
    • Keine fehlenden Werte
    • Daten im numerischen Format
    • Daten in einem pandas-DataFrame oder NumPy-Array

 

  • Erster Schritt: explorative Datenanalyse (EDA)
Überwachtes Lernen mit scikit-learn

Syntax von scikit-learn

from sklearn.module import Model

model = Model()
model.fit(X, y)
predictions = model.predict(X_new)
print(predictions)
array([0, 0, 0, 0, 1, 0])
Überwachtes Lernen mit scikit-learn

Lass uns üben!

Überwachtes Lernen mit scikit-learn

Preparing Video For Download...