A/B testing

Analisis Data Bayesian dengan Python

Michal Oleszak

Machine Learning Engineer

A/B testing

  • Eksperimen acak: bagi pengguna menjadi dua grup (A dan B)

 

 

Dua grup pengguna.

1 Gambar: diadaptasi dari https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Analisis Data Bayesian dengan Python

A/B testing

  • Eksperimen acak: bagi pengguna menjadi dua grup (A dan B)
  • Tunjukkan tiap grup versi berbeda dari sesuatu (mis. tata letak situs)

 

Dua grup pengguna melihat dua tata letak situs berbeda.

1 Gambar: diadaptasi dari https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Analisis Data Bayesian dengan Python

A/B testing

  • Eksperimen acak: bagi pengguna menjadi dua grup (A dan B)
  • Tunjukkan tiap grup versi berbeda dari sesuatu (mis. tata letak situs)
  • Bandingkan mana yang lebih baik pada suatu metrik (mis. click-through rate)

Dua grup pengguna melihat dua tata letak situs berbeda, salah satunya dengan rasio klik lebih tinggi.

1 Gambar: diadaptasi dari https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Analisis Data Bayesian dengan Python

A/B testing: pendekatan frequentist

  • Berbasis uji hipotesis
  • Periksa apakah A dan B kinerjanya sama atau tidak
  • Tidak menyatakan seberapa banyak A lebih baik dari B
Analisis Data Bayesian dengan Python

A/B testing: pendekatan Bayesian

  • Hitung laju klik posterior untuk tata letak A dan B lalu bandingkan
  • Hitung langsung probabilitas A lebih baik dari B
  • Kuantifikasi seberapa lebih baik
  • Estimasi kerugian ekspektasi jika keputusan salah
Analisis Data Bayesian dengan Python

A/B testing: pendekatan Bayesian

  • Saat pengguna membuka situs, ada dua kemungkinan:
    • Klik (sukses)
    • Tidak klik (gagal)
  • Gunakan distribusi binomial! (probabilitas sukses = rasio klik)
Analisis Data Bayesian dengan Python

Simulasikan posterior beta

Kita tahu jika prior adalah $Beta(a, b)$, maka posterior adalah $Beta(x, y)$, dengan:

$x = \text{NumberOfSuccesses} + a$

$y = \text{NumberOfObservations} - \text{NumberOfSuccesses} + b$

def simulate_beta_posterior(trials, beta_prior_a, beta_prior_b):
    num_successes = np.sum(trials)
    posterior_draws = np.random.beta(
      num_successes + beta_prior_a, 
      len(trials) - num_successes + beta_prior_b, 
      10000
    )
    return posterior_draws
Analisis Data Bayesian dengan Python

Membandingkan posterior

Daftar 1 (klik) dan 0 (tanpa klik):

print(A_clicks)
print(B_clicks)
[0 1 1 0 0 0 0 0 0 0 1 ... ]
[0 0 0 1 0 0 0 1 1 0 1 ... ]

 

Simulasikan sampel posterior untuk tiap tata letak:

A_posterior = simulate_beta_posterior(A_clicks, 1, 1)
B_posterior = simulate_beta_posterior(B_clicks, 1, 1)

Plot posterior:

sns.kdeplot(A_posterior, shade=True, label="A")
sns.kdeplot(B_posterior, shade=True, label="B")
plt.show()

Dua plot kerapatan posterior, saling tumpang tindih sebagian.

Analisis Data Bayesian dengan Python

Membandingkan posterior

Selisih posterior antara B dan A:

diff = B_posterior - A_posterior

sns.kdeplot(diff, shade=True, label="difference: A-B")
plt.show()

Plot kerapatan dengan hampir seluruh massa probabilitas di atas nol.

Probabilitas B lebih baik:

(diff > 0).mean()
0.9639
Analisis Data Bayesian dengan Python

Kerugian ekspektasi

Jika kita merilis versi situs yang lebih buruk, berapa banyak klik yang hilang?

# Perbedaan (B-A) saat A lebih baik 
loss = diff[diff < 0]


# Kerugian ekspektasi (rata-rata) expected_loss = loss.mean() print(expected_loss)
-0.0077850237030215215
Analisis Data Bayesian dengan Python

Data iklan

print(ads)
                               user_id   product site_version                 time  banner_clicked
0     f500b9f27ac611426935de6f7a52b71f   clothes      desktop  2019-01-28 16:47:08               0
1     cb4347c030a063c63a555a354984562f  sneakers       mobile  2019-03-31 17:34:59               0
2     89cec38a654319548af585f4c1c76b51   clothes       mobile  2019-02-06 09:22:50               0
3     1d4ea406d45686bdbb49476576a1a985  sneakers       mobile  2019-05-23 08:07:07               0
4     d14b9468a1f9a405fa801a64920367fe   clothes       mobile  2019-01-28 08:16:37               0
...                                ...       ...          ...                  ...             ...
9995  7ca28ccde263a675d7ab7060e9ed0eca   clothes       mobile  2019-02-02 08:19:39               0
9996  7e2ec2631332c6c4527a1b78c7ede789   clothes       mobile  2019-04-04 03:27:05               0
9997  3b828da744e5785f1e67b5df3fda5571   clothes       mobile  2019-04-15 15:59:06               0
9998  6cce0527245bcc8519d698af2224c04a   clothes       mobile  2019-05-21 20:43:21               0
9999  8cf87a02f96327a1a8a93814f34d0d0c  sneakers       mobile  2019-03-02 21:27:57               0
Analisis Data Bayesian dengan Python

Ayo berlatih!

Analisis Data Bayesian dengan Python

Preparing Video For Download...