Lokale validatie

Een Kaggle-competitie winnen met Python

Yauhen Babakhin

Kaggle Grandmaster

Motivatie

overfitting-voorbeeld met Public en Private leaderboards

Een Kaggle-competitie winnen met Python

Holdout-set

schema holdout-set

Een Kaggle-competitie winnen met Python

Holdout-set

schema holdout-set

Een Kaggle-competitie winnen met Python

Holdout-set

schema holdout-set

Een Kaggle-competitie winnen met Python

K-fold cross-validatie

 

split train data into four folds

Een Kaggle-competitie winnen met Python

K-fold cross-validatie

 

schema k-fold cross-validatie

Een Kaggle-competitie winnen met Python

K-fold cross-validatie

# Import KFold
from sklearn.model_selection import KFold
# Maak een KFold-object
kf = KFold(n_splits=5, shuffle=True, random_state=123)
# Loop door elke cross-validatiesplit
for train_index, test_index in kf.split(train):

# Pak train- en testdata voor deze split cv_train, cv_test = train.iloc[train_index], train.iloc[test_index]
Een Kaggle-competitie winnen met Python

Gestratificeerde k-fold

  schema gestratificeerde k-fold cross-validatie

Een Kaggle-competitie winnen met Python

Gestratificeerde k-fold

# Import StratifiedKFold
from sklearn.model_selection import StratifiedKFold

# Maak een StratifiedKFold-object str_kf = StratifiedKFold(n_splits=5, shuffle=True, random_state=123)
# Loop door elke cross-validatiesplit for train_index, test_index in str_kf.split(train, train['target']): cv_train, cv_test = train.iloc[train_index], train.iloc[test_index]
Een Kaggle-competitie winnen met Python

Laten we oefenen!

Een Kaggle-competitie winnen met Python

Preparing Video For Download...