Müşteri işlemlerini tahmin etme

Python ile Pazarlama için Machine Learning

Karolis Urbonas

Head of Analytics & Science, Amazon

Modelleme yaklaşımı

  • Gelecek ayın işlem sayısını tahmin için doğrusal regresyon.
  • Lojistik regresyonla aynı modelleme adımları.
Python ile Pazarlama için Machine Learning

Modelleme adımları

  1. Veriyi eğitime ve teste ayırın
  2. Modeli başlatın
  3. Modeli eğitim verisiyle eğitin
  4. Test verisinde tahmin yapın
  5. Test verisinde performansı ölçün
Python ile Pazarlama için Machine Learning

Regresyon performans metrikleri

Temel metrikler:

  • Kök ortalama kare hata (RMSE) - Tahmin ile gerçeğin kare farklarının ortalamasının karekökü
  • Ortalama mutlak hata (MAE) - Tahmin ile gerçeğin mutlak farklarının ortalaması
  • Ortalama mutlak yüzde hata (MAPE) - Tahmin ile gerçeğin yüzde farklarının ortalaması (gerçekler sıfır olamaz)
Python ile Pazarlama için Machine Learning

Ek regresyon ve gözetimli öğrenme metrikleri

  • R-kare - modelin açıkladığı varyans oranını gösteren istatistiksel ölçü. Yalnızca regresyona uygundur, sınıflamaya değil. Daha yüksek daha iyidir.

  • Katsayı p-değerleri - katsayının şans eseri gözlenme olasılığı. Daha düşük daha iyidir. Tipik eşikler %5 ve %10’dur.

Python ile Pazarlama için Machine Learning

Modeli eğitme

# Doğrusal regresyon modülünü içe aktarın
from sklearn.linear_model import LinearRegression

# Regresyon örneğini başlatın linreg = LinearRegression()
# Modeli eğitim verisiyle eğitin linreg.fit(train_X, train_Y)
# Eğitim ve test verisinde tahmin yapın train_pred_Y = linreg.predict(train_X) test_pred_Y = linreg.predict(test_X)
Python ile Pazarlama için Machine Learning

Model performansını ölçme

# Performans ölçüm fonksiyonlarını içe aktarın
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error

# Eğitim verisi için metrikleri hesaplayın rmse_train = np.sqrt(mean_squared_error(train_Y, train_pred_Y)) mae_train = mean_absolute_error(train_Y, train_pred_Y)
# Test verisi için metrikleri hesaplayın rmse_test = np.sqrt(mean_squared_error(test_Y, test_pred_Y)) mae_test = mean_absolute_error(test_Y, test_pred_Y)
# Performans metriklerini yazdırın print('RMSE train: {:.3f}; RMSE test: {:.3f}\nMAE train: {:.3f}, MAE test: {:.3f}'.format( rmse_train, rmse_test, mae_train, mae_test))
RMSE train: 0.717; RMSE test: 1.216
MAE train: 0.514, MAE test: 0.555
Python ile Pazarlama için Machine Learning

Katsayıları yorumlama

  • İstatistiksel anlamlılığı değerlendirmek gerekir
  • statsmodels kütüphanesine giriş
  • Ayrıntılı model özeti sunar
Python ile Pazarlama için Machine Learning

statsmodels ile regresyon modeli kurma

# Kütüphaneyi içe aktarın
import statsmodels.api as sm

# Hedef değişkeni `numpy` dizisine dönüştürün train_Y = np.array(train_Y)
# Modeli başlatın ve eğitin olsreg = sm.OLS(train_Y, train_X) olsreg = olsreg.fit()
# Model özetini yazdırın print(olsreg.summary())
Python ile Pazarlama için Machine Learning

Regresyon özet tablosu

OLS özeti

Python ile Pazarlama için Machine Learning

R-kareyi yorumlama

R-kare

Python ile Pazarlama için Machine Learning

Katsayı p-değerlerini yorumlama

Katsayı p-değerleri

Python ile Pazarlama için Machine Learning

Haydi bazı regresyon modelleri kuralım!

Python ile Pazarlama için Machine Learning

Preparing Video For Download...