De vloek van dimensionaliteit

Dimensionality Reduction in Python

Jeroen Boeye

Head of Machine Learning, Faktion

Van observatie naar patroon

Stad Prijs
Berlijn 2
Parijs 3
Dimensionality Reduction in Python

Van observatie naar patroon

Stad Prijs
Berlijn 2
Parijs 3

saaie verdelingsplot

Dimensionality Reduction in Python

Van observatie naar patroon

Stad Prijs
Berlijn 2.0
Berlijn 3.1
Berlijn 4.3
Parijs 3.0
Parijs 5.2
... ...

Verdeling Berlijn vs. Parijs

Dimensionality Reduction in Python

Een stadsclassifier bouwen - data splitten

Splits de doel-feature van de features om het model op te trainen.

y = house_df['City']

X = house_df.drop('City', axis=1)

Voer een splitsing uit met 70% train en 30% testdata

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
Dimensionality Reduction in Python

Een stadsclassifier bouwen - model fitten

Maak een Support Vector Machine-classifier en fit op de trainingsdata

from sklearn.svm import SVC

svc = SVC()

svc.fit(X_train, y_train)
Dimensionality Reduction in Python

Een stadsclassifier bouwen - voorspellen

from sklearn.metrics import accuracy_score

print(accuracy_score(y_test, svc.predict(X_test)))
0.826
print(accuracy_score(y_train, svc.predict(X_train)))
0.832
Dimensionality Reduction in Python

Features toevoegen

Stad Prijs
Berlijn 2.0
Berlijn 3.1
Berlijn 4.3
Parijs 3.0
Parijs 5.2
... ...

Verdeling Berlijn vs. Parijs

Dimensionality Reduction in Python

Features toevoegen

Stad Prijs n_floors n_bathroom surface_m2
Berlijn 2.0 1 1 190
Berlijn 3.1 2 1 187
Berlijn 4.3 2 2 240
Parijs 3.0 2 1 170
Parijs 5.2 2 2 290
... ... ... ... ...
Dimensionality Reduction in Python

Laten we oefenen!

Dimensionality Reduction in Python

Preparing Video For Download...