A/B-testen

Bayesian Data Analysis in Python

Michal Oleszak

Machine Learning Engineer

A/B-testen

  • Gerandomiseerd experiment: verdeel gebruikers in twee groepen (A en B)

 

 

Twee groepen gebruikers.

1 Afbeelding: aangepast van https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Bayesian Data Analysis in Python

A/B-testen

  • Gerandomiseerd experiment: verdeel gebruikers in twee groepen (A en B)
  • Laat elke groep een andere versie zien (bijv. website‑lay‑out)

 

Twee groepen gebruikers die twee verschillende website‑lay‑outs zien.

1 Afbeelding: aangepast van https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Bayesian Data Analysis in Python

A/B-testen

  • Gerandomiseerd experiment: verdeel gebruikers in twee groepen (A en B)
  • Laat elke groep een andere versie zien (bijv. website‑lay‑out)
  • Vergelijk welke groep beter scoort op een metric (bijv. doorklikratio)

Twee groepen gebruikers die twee verschillende website‑lay‑outs zien, waarvan één een hogere klikratio heeft.

1 Afbeelding: aangepast van https://commons.wikimedia.org/wiki/File:A-B_testing_simple_example.png
Bayesian Data Analysis in Python

A/B-testen: frequentistische aanpak

  • Gebaseerd op hypothesetesten
  • Check of A en B hetzelfde presteren of niet
  • Zegt niet hoeveel beter A is dan B
Bayesian Data Analysis in Python

A/B-testen: Bayesiaanse aanpak

  • Bereken posterior doorklikpercentages voor lay-outs A en B en vergelijk ze
  • Bereken direct de kans dat A beter is dan B
  • Kwantificeer hoeveel beter
  • Schat het verwachte verlies bij een verkeerde keuze
Bayesian Data Analysis in Python

A/B-testen: Bayesiaanse aanpak

  • Als een gebruiker landt op de site, zijn er twee uitkomsten:
    • Klik (succes)
    • Geen klik (mislukt)
  • Gebruik de binomiale verdeling! (kans op succes = klikratio)
Bayesian Data Analysis in Python

Simuleer beta-posterior

We weten: als de prior $Beta(a, b)$ is, dan is de posterior $Beta(x, y)$, met:

$x = \text{NumberOfSuccesses} + a$

$y = \text{NumberOfObservations} - \text{NumberOfSuccesses} + b$

def simulate_beta_posterior(trials, beta_prior_a, beta_prior_b):
    num_successes = np.sum(trials)
    posterior_draws = np.random.beta(
      num_successes + beta_prior_a, 
      len(trials) - num_successes + beta_prior_b, 
      10000
    )
    return posterior_draws
Bayesian Data Analysis in Python

Posteriors vergelijken

Lijsten met 1'en (kliks) en 0'en (geen kliks):

print(A_clicks)
print(B_clicks)
[0 1 1 0 0 0 0 0 0 0 1 ... ]
[0 0 0 1 0 0 0 1 1 0 1 ... ]

 

Simuleer posterior-trekkingen per lay-out:

A_posterior = simulate_beta_posterior(A_clicks, 1, 1)
B_posterior = simulate_beta_posterior(B_clicks, 1, 1)

Plot de posteriors:

sns.kdeplot(A_posterior, shade=True, label="A")
sns.kdeplot(B_posterior, shade=True, label="B")
plt.show()

Twee posterior-dichtheidsplots, deels overlappend.

Bayesian Data Analysis in Python

Posteriors vergelijken

Posteriorverschil tussen B en A:

diff = B_posterior - A_posterior

sns.kdeplot(diff, shade=True, label="difference: A-B")
plt.show()

Een dichtheidsplot met bijna alle kansmassa boven nul.

Kans dat B beter is:

(diff > 0).mean()
0.9639
Bayesian Data Analysis in Python

Verwacht verlies

Als we de slechtere versie live zetten, hoeveel kliks verliezen we?

# Verschil (B-A) wanneer A beter is 
loss = diff[diff < 0]


# Verwacht (gemiddeld) verlies expected_loss = loss.mean() print(expected_loss)
-0.0077850237030215215
Bayesian Data Analysis in Python

Advertentiegegevens

print(ads)
                               user_id   product site_version                 time  banner_clicked
0     f500b9f27ac611426935de6f7a52b71f   clothes      desktop  2019-01-28 16:47:08               0
1     cb4347c030a063c63a555a354984562f  sneakers       mobile  2019-03-31 17:34:59               0
2     89cec38a654319548af585f4c1c76b51   clothes       mobile  2019-02-06 09:22:50               0
3     1d4ea406d45686bdbb49476576a1a985  sneakers       mobile  2019-05-23 08:07:07               0
4     d14b9468a1f9a405fa801a64920367fe   clothes       mobile  2019-01-28 08:16:37               0
...                                ...       ...          ...                  ...             ...
9995  7ca28ccde263a675d7ab7060e9ed0eca   clothes       mobile  2019-02-02 08:19:39               0
9996  7e2ec2631332c6c4527a1b78c7ede789   clothes       mobile  2019-04-04 03:27:05               0
9997  3b828da744e5785f1e67b5df3fda5571   clothes       mobile  2019-04-15 15:59:06               0
9998  6cce0527245bcc8519d698af2224c04a   clothes       mobile  2019-05-21 20:43:21               0
9999  8cf87a02f96327a1a8a93814f34d0d0c  sneakers       mobile  2019-03-02 21:27:57               0
Bayesian Data Analysis in Python

Laten we A/B-testen!

Bayesian Data Analysis in Python

Preparing Video For Download...