R ile Pazar Sepeti Analizi
Christopher Bruffaerts
Statistician
Mağazada neler var?

Bugün ne almak istersiniz?

{"Bread", "Cheese", "Cheese", "Cheese"}
Pazar sepeti analizinin odağı

{"Bread", "Cheese"}
Mağazam - küme
X = {"Bread", "Butter", "Cheese", "Wine"}

X'in alt kümeleri - öğe kümeleri
Üst kümeler
Soru:
X'in tüm olası alt kümeleri kümesi nedir?
X = {A, B, C, D}

{"Bread"} $\cap$ {"Butter"} = $\emptyset$
{"Bread", "Butter"} $\cap$ {"Butter", "Wine"} = {"Butter"}
library(dplyr)
A = c("Bread", "Butter")
B = c("Bread", "Wine")
intersect(A,B)
[1] "Bread"
{"Bread"} $\cup$ {"Butter"} = {"Bread", "Butter"}
union(A,B)
[1] "Bread" "Butter" "Wine"
Soru:
Boyutu n olan bir kümeden boyutu k olan kaç alt küme vardır?
"n'in k'li kombinasyonu"
$${n \choose k} = \dfrac{n!}{(n-k)! k!},$$ şöyle ki
$n! = n \times (n-1) \times (n-2) \times ...\times 2 \times 1$
Örnek:
Mağazadan 2 farklı ürünlü sepet sayısı:

$${4 \choose 2} = \dfrac{4!}{(4-2)! 2!} = 6$$
Soru
Boyutu n olan bir kümeden kaç olası sepet oluşturulabilir?
Newton binomu
$$\sum_{k=0}^n{n \choose k} = 2^n$$
2^(n_items)
Örnek
Toplam sepet sayısı:
$$2^4 = 16$$

R'da kombinasyonlar
n_items = 4
basket_size = 2
choose(n_items, basket_size)
[1] 6
# Tüm olası değerler için döngü
store = matrix(NA, nrow=5, ncol=2)
for (i in 0:n_items){
store[i+1,] = c(i, choose(n_items,i))}
Çıktı
colnames(store)=c("size", "nb_combi")
store
size nb_combi
[1,] 0 1
[2,] 1 4
[3,] 2 6
[4,] 3 4
[5,] 4 1
Kombinasyon sayısının ne kadar hızlı arttığını görün
n_items = 50
fun_nk = function(x) choose(n_items, x)
# Grafik
ggplot(data = data.frame(x = 0),
mapping = aes(x=x))+
stat_function(fun = fun_nk)+
xlim(0, n_items)+
xlab("Alt küme boyutu")+
ylab("Alt küme sayısı")

R ile Pazar Sepeti Analizi