Kombinasi item

Analisis Keranjang Belanja di R

Christopher Bruffaerts

Statistician

Kembali ke toko bahan makanan

Apa saja di toko?

semua_produk_emoji

Anda ingin apa hari ini?

roti_3keju

{"Bread", "Cheese", "Cheese", "Cheese"}

Fokus analisis market basket

roti_keju

{"Bread", "Cheese"}

Analisis Keranjang Belanja di R

Subset dan superset

Tokoku - himpunan

X = {"Bread", "Butter", "Cheese", "Wine"}

semua_produk_emoji

Subset dari X - itemset

  • Ukuran 0: { ${ \emptyset }$ }
  • Ukuran 1: {"Bread"}, {"Wine"}, ...
  • Ukuran 2: {"Bread", "Wine"}, ...

Superset

  • {"Bread", "Butter"} superset dari {"Bread"}
  • {"Bread", "Butter", "Cheese", "Wine"} superset dari {"Bread", "Butter"}
Analisis Keranjang Belanja di R

Graf itemset

Pertanyaan:

Apa himpunan semua subset yang mungkin dari X?

X = {A, B, C, D}

graf_itemset

Analisis Keranjang Belanja di R

Irisan dan gabungan

  • Irisan

{"Bread"} $\cap$ {"Butter"} = $\emptyset$

{"Bread", "Butter"} $\cap$ {"Butter", "Wine"} = {"Butter"}

library(dplyr)
A = c("Bread", "Butter")
B = c("Bread", "Wine")
intersect(A,B)
[1] "Bread"
  • Gabungan

{"Bread"} $\cup$ {"Butter"} = {"Bread", "Butter"}

union(A,B)
[1] "Bread"  "Butter" "Wine"
Analisis Keranjang Belanja di R

Berapa banyak keranjang ukuran k?

Pertanyaan:

Berapa banyak subset berukuran k dari himpunan berukuran n?

"n pilih k"

$${n \choose k} = \dfrac{n!}{(n-k)! k!},$$ where

$n! = n \times (n-1) \times (n-2) \times ...\times 2 \times 1$

Contoh:

Jumlah keranjang dengan 2 item berbeda dari toko:

semua_produk_emoji

$${4 \choose 2} = \dfrac{4!}{(4-2)! 2!} = 6$$

Analisis Keranjang Belanja di R

Berapa banyak keranjang yang mungkin?

Pertanyaan

Berapa banyak keranjang yang dapat dibuat dari himpunan berukuran n?

Binom Newton

$$\sum_{k=0}^n{n \choose k} = 2^n$$

2^(n_items)

Contoh

Total jumlah keranjang:

$$2^4 = 16$$

semua_produk_emoji

Analisis Keranjang Belanja di R

Berapa banyak keranjang di R?

Kombinasi di R

n_items = 4
basket_size = 2
choose(n_items, basket_size)
[1] 6
# Melintasi semua nilai yang mungkin
store = matrix(NA, nrow=5, ncol=2)
for (i in 0:n_items){
  store[i+1,] = c(i, choose(n_items,i))}

Keluaran

colnames(store)=c("size", "nb_combi")
store
     size nb_combi
[1,]    0        1
[2,]    1        4
[3,]    2        6
[4,]    3        4
[5,]    4        1
Analisis Keranjang Belanja di R

Memplot jumlah kombinasi

Gambaran seberapa cepat jumlah kombinasi bertambah

n_items = 50
fun_nk = function(x) choose(n_items, x)
# Plotting
ggplot(data = data.frame(x = 0),
    mapping = aes(x=x))+
  stat_function(fun = fun_nk)+
  xlim(0, n_items)+
  xlab("Subset size")+
  ylab("Number of subsets")

distribusi_kombinasi

Analisis Keranjang Belanja di R

Siap menghitung?

Analisis Keranjang Belanja di R

Preparing Video For Download...