Scheve variabelen beheren

Klantsegmentatie in Python

Karolis Urbonas

Head of Data Science, Amazon

Scheefheid herkennen

  • Visuele analyse van de verdeling
  • Heeft het een staart? Dan is het scheef

Klantsegmentatie in Python

Verdeling van recency verkennen

sns.distplot(datamart['Recency'])
plt.show()

Klantsegmentatie in Python

Verdeling van frequentie verkennen

sns.distplot(datamart['Frequency'])
plt.show()

Klantsegmentatie in Python

Transformaties om scheefheid te beheren

  • Logaritmische transformatie (alleen positieve waarden)
import numpy as np
frequency_log= np.log(datamart['Frequency'])

sns.distplot(frequency_log) plt.show()

Klantsegmentatie in Python

Omgaan met negatieve waarden

  • Constante toevoegen vóór logtransformatie
  • Derdeworteltransformatie
Klantsegmentatie in Python

Laten we oefenen met het herkennen en beheren van scheve variabelen!

Klantsegmentatie in Python

Preparing Video For Download...