Classificatiemodellen

Modelvalidatie in Python

Kasey Jones

Data Scientist

Classificatiemodellen

  • Categorische uitkomsten:
    • Haarkleur van een pasgeborene
    • Winnaar van een basketbalwedstrijd
    • Genre van het volgende liedje op de radio
Modelvalidatie in Python

De Tic-Tac-Toe-dataset

... Onder-Links Onder-Midden Onder-Rechts Klasse
... X O O positief
... O X O positief
... O O X positief
... X X O negatief
... ... ... ... ...
Modelvalidatie in Python

Google speelt Boter-Kaas-en-Eieren met je. Ga naar Google en zoek op Tic-Tac-Toe.

Modelvalidatie in Python

.predict() gebruiken voor classificatie

from sklearn.ensemble import RandomForestClassifier
rfc = RandomForestClassifier(random_state=1111)
rfc.fit(X_train, y_train)
rfc.predict(X_test)
array([1, 1, 1, 1, 0, 1, ...])
pd.Series(rfc.predict(X_test)).value_counts()
1    627
0    331
Modelvalidatie in Python

Kansen voorspellen

rfc.predict_proba(X_test)
array([[0. , 1. ],
       [0.1, 0.9],
       [0.1, 0.9],
       ...])
Modelvalidatie in Python
rfc = RandomForestClassifier(random_state=1111)
rfc.get_params()
{'bootstrap': True,
 'class_weight': None,
 'criterion': 'gini',
 ...}
rfc.fit(X_train, y_train)
rfc.score(X_test, y_test)
0.8989
Modelvalidatie in Python

Laten we eindspellen van Boter-Kaas-en-Eieren classificeren

Modelvalidatie in Python

Preparing Video For Download...