Ottimizzare il modello

Marketing Analytics: Prevedere il churn dei clienti in Python

Mark Peterson

Director of Data Science, Infoblox

Ripasso

from sklearn.svm import SVC

svc = SVC()

svc.fit(telco['data'], telco['target'])
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
  decision_function_shape='ovr', degree=3, gamma='scale', kernel='rbf',
  max_iter=-1, probability=False, random_state=None, shrinking=True,
  tol=0.001, verbose=False)
Marketing Analytics: Prevedere il churn dei clienti in Python

Iperparametri della random forest

Parametro Scopo
n_estimators Numero di alberi
criterion Qualità dello split
max_features Numero di feature per lo split migliore
max_depth Profondità massima dell'albero
min_sample_splits Minimo campioni per dividere un nodo
bootstrap Uso di campioni bootstrap
Marketing Analytics: Prevedere il churn dei clienti in Python

Grid search

Marketing Analytics: Prevedere il churn dei clienti in Python

Grid search in sklearn

from sklearn.model_selection import GridSearchCV

param_grid = {'n_estimators': np.arange(10, 51)}
clf_cv = GridSearchCV(RandomForestClassifier(), param_grid)
clf_cv.fit(X, y)
clf_cv.best_params_
{'n_estimators': 43}
clf_cv.best_score_
0.9237923792379238
Marketing Analytics: Prevedere il churn dei clienti in Python

Buon tuning!

Marketing Analytics: Prevedere il churn dei clienti in Python

Preparing Video For Download...