Machine Learning per il marketing con Python
Karolis Urbonas
Head of Analytics & Science, Amazon
Metriche chiave:
R-quadro - misura statistica della quota di varianza spiegata dal modello. Solo per regressione, non per classificazione. Più alto è meglio.
p-value dei coefficienti - probabilità che il coefficiente (di regressione o classificazione) sia osservato per caso. Più basso è meglio. Soglie tipiche: 5% e 10%.
# Importa il modulo di regressione lineare from sklearn.linear_model import LinearRegression# Inizializza l'istanza di regressione linreg = LinearRegression()# Adatta il modello sui dati di training linreg.fit(train_X, train_Y)# Predici sui dati di training e di test train_pred_Y = linreg.predict(train_X) test_pred_Y = linreg.predict(test_X)
# Importa le funzioni per misurare le prestazioni from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squared_error# Calcola le metriche sui dati di training rmse_train = np.sqrt(mean_squared_error(train_Y, train_pred_Y)) mae_train = mean_absolute_error(train_Y, train_pred_Y)# Calcola le metriche sui dati di test rmse_test = np.sqrt(mean_squared_error(test_Y, test_pred_Y)) mae_test = mean_absolute_error(test_Y, test_pred_Y)# Stampa le metriche di prestazione print('RMSE train: {:.3f}; RMSE test: {:.3f}\nMAE train: {:.3f}, MAE test: {:.3f}'.format( rmse_train, rmse_test, mae_train, mae_test))
RMSE train: 0.717; RMSE test: 1.216
MAE train: 0.514, MAE test: 0.555
statsmodels# Importa la libreria import statsmodels.api as sm# Converti la variabile target in array `numpy` train_Y = np.array(train_Y)# Inizializza e adatta il modello olsreg = sm.OLS(train_Y, train_X) olsreg = olsreg.fit()# Stampa il riepilogo del modello print(olsreg.summary())


Machine Learning per il marketing con Python