Machine Learning per il marketing con Python
Karolis Urbonas
Head of Analytics & Science, Amazon
Segmentazione con K-means (per k cluster):
from sklearn.cluster import KMeanskmeans=KMeans(n_clusters=k)kmeans.fit(wholesale_scaled_df)wholesale_kmeans4 = wholesale.assign(segment = kmeans.labels_)
Segmentazione con NMF (k cluster):
from sklearn.decomposition import NMF
nmf = NMF(k)
nmf.fit(wholesale)
components = pd.DataFrame(nmf.components_, columns=wholesale.columns)
Estrazione dell’assegnazione ai segmenti:
segment_weights = pd.DataFrame(nmf.transform(wholesale, columns=components.index)
segment_weights.index = wholesale.index
wholesale_nmf = wholesale.assign(segment = segment_weights.idxmax(axis=1))
k)k: 1) Matematico, 2) Test & learnkSSE) per ciascunoSSE contro k e individua il “gomito”: benefici marginali decrescenti nella riduzione dell’erroresse = {}
for k in range(1, 11):
kmeans=KMeans(n_clusters=k, random_state=333)
kmeans.fit(wholesale_scaled_df)
sse[k] = kmeans.inertia_
plt.title('Elbow criterion method chart')
sns.pointplot(x=list(sse.keys()), y=list(sse.values()))
plt.show()
k ottimaleMachine Learning per il marketing con Python