Stemmen

Ensemblemethoden in Python

Román de las Heras

Data Scientist, Appodeal

Vraag het publiek

vraag-het-het-publiek.gif

Wijsheid van de massa

  • Collectieve intelligentie
  • Grote groep ≥ enkele expert
  • Probleemoplossing
  • Besluitvorming
  • Innovatie
  • Voorspelling
Ensemblemethoden in Python

Meerderheidsstemming

Eigenschappen

  • Classificatieproblemen
  • Meerderheidsstemming: modus
  • Oneven aantal classifiers (≥3)

multi-modale-voorspelling.png

Kenmerken van een wijze groep:

  • Divers: verschillende algoritmen of datasets
  • Onafhankelijk en niet-gecorreleerd
  • Gebruik individuele kennis
  • Agregeer individuele voorspellingen
Ensemblemethoden in Python

Voting-ensemble met scikit-learn

from sklearn.ensemble import VotingClassifier

clf_voting = VotingClassifier( estimators=[ ('label1', clf_1), ('label2', clf_2), ('labelN', clf_N)])

Evalueren van de prestatie

# Get the accuracy score 
acc = accuracy_score(y_test, y_pred)
print("Accuracy: {:0.3f}".format(acc))
Accuracy: 0.938
# Create the individual models
clf_knn = KNeighborsClassifier(5)
clf_dt = DecisionTreeClassifier()
clf_lr = LogisticRegression()

# Create voting classifier clf_voting = VotingClassifier( estimators=[ ('knn', clf_knn), ('dt', clf_dt), ('lr', clf_lr)])
# Fit it to the training set and predict clf_voting.fit(X_train, y_train) y_pred = clf_voting.predict(X_test)
Ensemblemethoden in Python

Laten we oefenen!

Ensemblemethoden in Python

Preparing Video For Download...