Persiapan data untuk segmentasi

Machine Learning untuk Pemasaran dengan Python

Karolis Urbonas

Head of Analytics & Science, Amazon

Asumsi model

  • Mulai dengan K-means
  • K-means bekerja baik saat data 1) ~terdistribusi normal (tanpa skew) dan 2) terstandarisasi (mean = 0, standard deviation = 1)
  • Model kedua - NMF - dapat digunakan pada data mentah, khususnya jika matriksnya jarang (sparse)
Machine Learning untuk Pemasaran dengan Python

Mengurangi skew dengan transformasi log

# Opsi pertama - transformasi log
wholesale_log = np.log(wholesale)
sns.pairplot(wholesale_log, diag_kind='kde')
plt.show()
Machine Learning untuk Pemasaran dengan Python

Jelajahi data hasil transformasi log

Pairplot tertransformasi log

Machine Learning untuk Pemasaran dengan Python

Mengurangi skew dengan transformasi Box-Cox

# Opsi kedua - transformasi Box-Cox
from scipy import stats

def boxcox_df(x):
    x_boxcox, _ = stats.boxcox(x)
    return x_boxcox

wholesale_boxcox = wholesale.apply(boxcox_df, axis=0)
sns.pairplot(wholesale_boxcox, diag_kind='kde')
plt.show()
Machine Learning untuk Pemasaran dengan Python

Jelajahi data hasil transformasi Box-Cox

Pairplot Box-Cox

Machine Learning untuk Pemasaran dengan Python

Skalakan data

  • Kurangi setiap nilai kolom dengan rata-rata kolom
  • Bagi setiap nilai kolom dengan simpangan baku kolom
  • Gunakan modul StandardScaler() dari sklearn
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()

scaler.fit(wholesale_boxcox) wholesale_scaled = scaler.transform(wholesale_boxcox) wholesale_scaled_df = pd.DataFrame(data=wholesale_scaled, index=wholesale_boxcox.index, columns=wholesale_boxcox.columns) wholesale_scaled_df.agg(['mean','std']).round()
      Fresh  Milk  Grocery  Frozen  Detergents_Paper  Delicassen
mean   -0.0   0.0      0.0     0.0              -0.0         0.0
std     1.0   1.0      1.0     1.0               1.0         1.0
Machine Learning untuk Pemasaran dengan Python

Ayo berlatih!

Machine Learning untuk Pemasaran dengan Python

Preparing Video For Download...