Oran metrikleri ve delta yöntemi

Python ile A/B Testi

Moe Lotfy, PhD

Principal Data Science Manager

Oran metrikleri A/B testi

  • Ortalama metrikler

Ortalama metrik örneği: ortalama sipariş değeri ve sayfada ortalama süre

  • Analiz birimi:

    • A/B testinde analiz edilen varlık
    • Oran metriklerinde payda
  • Rastgeleleştirme birimi:

    • Her varyanta rastgele atanan denek
Python ile A/B Testi

Oran metrikleri A/B testi

  • Kullanıcı başına oran metrikleri

Oran metrik örneği: tıklama oranı ve oturum başına gelir

Python ile A/B Testi

Delta yöntemi motivasyonu

print(checkout.groupby('checkout_page')[['order_value','purchased']].agg({'sum','count','mean'}))
              order_value                     purchased              
                     mean           sum count      mean     sum count
checkout_page                                                        
A               24.956437  61417.791564  2461  0.820333  2461.0  3000
B               29.876202  75915.430125  2541  0.847000  2541.0  3000
C               34.917589  90890.484142  2603  0.867667  2603.0  3000
checkout.groupby('checkout_page')['order_value'].sum()/
checkout.groupby('checkout_page')['purchased'].count()
checkout_page
A    20.472597
B    25.305143
C    30.296828
dtype: float64
Python ile A/B Testi

Delta yöntemi varyansı

  • Delta yöntemi ile oran metriklerinin varyans tahmini:{

Delta yöntemi varyans formülü

# Oran metriğinin delta yöntemi varyansı
def var_delta(x,y): 
    x_bar = np.mean(x)
    y_bar = np.mean(y)
    x_var = np.var(x,ddof=1)
    y_var = np.var(y,ddof=1)
    cov_xy = np.cov(x,y,ddof=1)[0][1]
    # Not: Test istatistiğinin paydasında standart hata (=sqrt(var/n)) olduğundan burada len(x) ile bölüyoruz
    var_ratio = (x_var/y_bar**2 + y_var*(x_bar**2/y_bar**4) - 2*cov_xy*(x_bar/y_bar**3))/len(x)
    return var_ratio
1 Budylin, Roman & Drutsa, Alexey & Katsev, Ilya & Tsoy, Valeriya. (2018). Consistent Transformation of Ratio Metrics for Efficient Online Controlled Experiments. 55-63. 10.1145/3159652.3159699.
Python ile A/B Testi

Delta yöntemi z-testi

# Delta method ztest calculation 
ztest_delta(x_control,y_control,x_treatment,y_treatment, alpha = 0.05)

Girdi argümanları:

  • x_control: kontrol varyantı kullanıcı düzeyi oran pay kolonu
  • y_control: kontrol varyantı kullanıcı düzeyi oran payda kolonu
  • x_treatment: tedavi varyantı kullanıcı düzeyi oran pay kolonu
  • y_treatment: tedavi varyantı kullanıcı düzeyi oran payda kolonu
  • alpha: anlamlılık düzeyi.

Çıktı:

  • mean_control: kontrol grubunun oran metriği ortalaması
  • mean_treatment: tedavi grubunun oran metriği ortalaması
  • difference: tedavi ve kontrol ortalamaları farkı
  • diff_CI: ortalama farkı için güven aralığı
  • p-value: iki kuyruklu z-test p-değeri
1 https://medium.com/@ahmadnuraziz3/applying-delta-method-for-a-b-tests-analysis-8b1d13411c22
Python ile A/B Testi

Python örneği

# Varyant A ve B için kullanıcı başına metrik DataFrame'leri oluşturma
A_per_user = pd.DataFrame({'order_value':checkout[checkout['checkout_page']=='A'].groupby('user_id')['order_value'].sum()
                            ,'page_view':checkout[checkout['checkout_page']=='A'].groupby('user_id')['user_id'].count()})
B_per_user = pd.DataFrame({'order_value':checkout[checkout['checkout_page']=='B'].groupby('user_id')['order_value'].sum()
                           ,'page_view':checkout[checkout['checkout_page']=='B'].groupby('user_id')['user_id'].count()})

# Kontrol ve tedavi oran kolonlarını atayın
x_control = A_per_user['order_value']
y_control = A_per_user['page_view']
x_treatment = B_per_user['order_value']
y_treatment = B_per_user['page_view']

# Oran metrikleri için z-testi çalıştırın
ztest_delta(x_control,y_control,x_treatment,y_treatment)
{'mean_control': 20.472597188012,
 'mean_treatment': 25.30514337484097,
 'difference': 4.833,
 'diff_CI': '[4.257, 5.408]',
 'p-value': 5.954978880467735e-61}
Python ile A/B Testi

Hadi pratik yapalım!

Python ile A/B Testi

Preparing Video For Download...