Validasi lokal

Memenangi Kompetisi Kaggle dengan Python

Yauhen Babakhin

Kaggle Grandmaster

Motivasi

contoh overfitting dengan papan peringkat Publik dan Privat

Memenangi Kompetisi Kaggle dengan Python

Holdout set

skema holdout set

Memenangi Kompetisi Kaggle dengan Python

Holdout set

skema holdout set

Memenangi Kompetisi Kaggle dengan Python

Holdout set

skema holdout set

Memenangi Kompetisi Kaggle dengan Python

Validasi silang k-fold

 

membagi data latih menjadi empat fold

Memenangi Kompetisi Kaggle dengan Python

Validasi silang k-fold

 

skema validasi silang k-fold

Memenangi Kompetisi Kaggle dengan Python

Validasi silang k-fold

# Import KFold
from sklearn.model_selection import KFold
# Create a KFold object
kf = KFold(n_splits=5, shuffle=True, random_state=123)
# Loop through each cross-validation split
for train_index, test_index in kf.split(train):

# Get training and testing data for the corresponding split cv_train, cv_test = train.iloc[train_index], train.iloc[test_index]
Memenangi Kompetisi Kaggle dengan Python

Stratified k-fold

  skema validasi silang stratified k-fold

Memenangi Kompetisi Kaggle dengan Python

Stratified k-fold

# Import StratifiedKFold
from sklearn.model_selection import StratifiedKFold

# Create a StratifiedKFold object str_kf = StratifiedKFold(n_splits=5, shuffle=True, random_state=123)
# Loop through each cross-validation split for train_index, test_index in str_kf.split(train, train['target']): cv_train, cv_test = train.iloc[train_index], train.iloc[test_index]
Memenangi Kompetisi Kaggle dengan Python

Ayo berlatih!

Memenangi Kompetisi Kaggle dengan Python

Preparing Video For Download...