Klantsegmentatie in Python
Karolis Urbonas
Head of Data Science, Amazon
Gedragssegmentatie van klanten op basis van drie metrics:
RFM-waarden kun je op meerdere manieren groeperen:
We gaan groeperen op basis van percentielen.
Stappen voor percentielen:
Data met acht CustomerID en willekeurig berekende Spend-waarden.
spend_quartiles = pd.qcut(data['Spend'], q=4, labels=range(1,5))data['Spend_Quartile'] = spend_quartilesdata.sort_values('Spend')
# Create numbered labels r_labels = list(range(4, 0, -1))# Divide into groups based on quartiles recency_quartiles = pd.qcut(data['Recency_Days'], q=4, labels=r_labels)# Create new column data['Recency_Quartile'] = recency_quartiles# Sort recency values from lowest to highest data.sort_values('Recency_Days')
Zoals je ziet zijn de kwartiel-labels omgekeerd, omdat recentere klanten waardevoller zijn.
We kunnen een lijst met strings of andere waarden definiëren, afhankelijk van de usecase.
# Create string labels r_labels = ['Active', 'Lapsed', 'Inactive', 'Churned']# Divide into groups based on quartiles recency_quartiles = pd.qcut(data['Recency_Days'], q=4, labels=r_labels) # Create new column data['Recency_Quartile'] = recency_quartiles # Sort values from lowest to highest data.sort_values('Recency_Days')
Aangepaste labels per kwartiel
Klantsegmentatie in Python