scikit-learn ile Supervised Learning
George Boorman
Core Curriculum Manager, DataCamp
Model başarımı, veriyi nasıl böldüğümüze bağlıdır
Görülmeyen veriye genelleme yeteneğini yansıtmaz
Çözüm: Çapraz doğrulama!










5 kat = 5 katlı ÇD
10 kat = 10 katlı ÇD
k kat = k katlı ÇD
Daha çok kat = Daha maliyetli hesaplama
from sklearn.model_selection import cross_val_score, KFoldkf = KFold(n_splits=6, shuffle=True, random_state=42)reg = LinearRegression()cv_results = cross_val_score(reg, X, y, cv=kf)
print(cv_results)
[0.70262578, 0.7659624, 0.75188205, 0.76914482, 0.72551151, 0.73608277]
print(np.mean(cv_results), np.std(cv_results))
0.7418682216666667 0.023330243960652888
print(np.quantile(cv_results, [0.025, 0.975]))
array([0.7054865, 0.76874702])
scikit-learn ile Supervised Learning