Hipotez oluşturma ve dağılımlar

Python ile A/B Testi

Moe Lotfy, PhD

Principal Data Science Manager

Hipotez tanımı

  • Hipotez şudur:

    • bir olayı açıklayan ifade
    • ileri inceleme için başlangıç noktası
    • test etmek istediğimiz bir fikir
  • Güçlü bir hipotez:

    • test edilebilir, bildirimseldir, öz ve mantıklıdır
    • sistematik yinelemeyi sağlar
    • genelleme ve kavrayışı kolaylaştırır
    • eyleme dönük/odaklı öneriler üretir
Python ile A/B Testi

Hipotez formatı

  • Genel çerçeve formatı:

    • X’e dayanarak, Y yaparsak
    • Z’nin olacağına inanıyoruz
    • M metriği/metrikleri ile ölçülür
  • Alternatif hipotez örneği:

    • Kullanıcı deneyimi araştırmasına dayanarak, ödeme sayfası tasarımını güncellersek
    • satın alan müşterilerin yüzdesi artacaktır
    • satın alma oranı ile ölçülür
  • Sıfır hipotezi: ...satın alan müşterilerin yüzdesi değişmeyecek...
Python ile A/B Testi

Örneklem istatistiklerini hesaplama

# Calculate the number of users in groups A and B
n_A = checkout[checkout['checkout_page'] == 'A']['purchased'].count()
n_B = checkout[checkout['checkout_page'] == 'B']['purchased'].count()
print('Group A users:',n_A)
print('Group B users:',n_B)
Group A users: 3000
Group B users: 3000
# Calculate the mean purchase rates of groups A and B
p_A = checkout[checkout['checkout_page'] == 'A']['purchased'].mean()
p_B = checkout[checkout['checkout_page'] == 'B']['purchased'].mean()
print('Group A mean purchase rate:',p_A)
print('Group B mean purchase rate:',p_B)
Group A mean purchase rate: 0.820
Group B mean purchase rate: 0.847
Python ile A/B Testi

Dağılımları simüle etme ve görselleştirme

Satın alma olasılığı p olan n denemedeki satın alan sayısı Binom dağılımına uyar.

# Import binom from scipy library 
from scipy.stats import binom 
# Create x-axis range and Binomial distributions A and B
x = np.arange(n_A*p_A - 100, n_B*p_B + 100) 
binom_a = binom.pmf(x, n_A, p_A)
binom_b = binom.pmf(x, n_B, p_B) 
# Plot Binomial distributions A and B
plt.bar(x, binom_a, alpha=0.4, label='Checkout A')
plt.bar(x, binom_b, alpha=0.4, label='Checkout B')
plt.xlabel('Purchased')
plt.ylabel('PMF')
plt.title('PMF of Checkouts Binomial distribution')
plt.show()

A ve B ödeme gruplarının Binom dağılımı

Python ile A/B Testi

Merkezi limit teoremi

Yeterince büyük örneklem için, örneklem ortalamalarının dağılımı, p,

  • gerçek ana kütle ortalaması etrafında normal dağılır
  • standart sapması = ortalamanın standart hatasıdır
  • alttaki verinin dağılımından bağımsızdır

Oranlar için merkezi limit teoremi formülü

Python ile A/B Testi

Python ile merkezi limit teoremi

# Set random seed for repeatability 
np.random.seed(47)
# Create an empty list to hold means
sampled_means = []
# Create loop to simulate 1000 sample means
for i in range(1000):
    # Take a sample of n=100
    sample = checkout['purchased'].sample(100,replace=True)
    # Get the sample mean and append to list
    sample_mean = np.mean(sample)
    sampled_means.append(sample_mean)
# Plot distribution
sns.displot(sampled_means, kde=True)
plt.show()

Python ile merkezi limit teoremi gösterimi. Örneklem boyutu büyüdükçe dağılım normale yaklaşır

Python ile A/B Testi

Hipotezlerin matematiksel gösterimi

# Import norm from scipy library 
from scipy.stats import norm
# Create x-axis range and normal distributions A and B
x = np.linspace(0.775, 0.9, 500)
norm_a = norm.pdf(x, p_A, np.sqrt(p_A*(1-p_A) / n_A))
norm_b = norm.pdf(x, p_B, np.sqrt(p_B*(1-p_B) / n_B))
# Plot normal distributions A and B
sns.lineplot(x=x, y=norm_a, ax=ax, label='Checkout A')
sns.lineplot(x=x, y=norm_b, color='orange', \
             ax=ax, label= 'Checkout B')
ax.axvline(p_A, linestyle='--')
ax.axvline(p_B, linestyle='--')
plt.xlabel('Purchased Proportion')
plt.ylabel('PDF')
plt.legend(loc="upper left")
plt.show()

Sıfır ve alternatif hipotezlerin ortalama farkı grafikleri

Sıfır ve alternatif hipotezlerin matematiksel gösterimi

Python ile A/B Testi

Hadi pratik yapalım!

Python ile A/B Testi

Preparing Video For Download...