R ile Pazar Sepeti Analizi
Christopher Bruffaerts
Statistician
Mağazada neler var?

Sepet 1: {"Bread", "Cheese"}
Sepet 2: {"Bread", "Wine" , "Cheese"}
Birden çok sepet
100 müşteri markete gelirse, birlikte görülen ürün ilişkilerini bulabilir miyiz?
Örnek: Bread ve Cheese

Sonuç: “bu ise, şu”
Birden çok sepetten öğrenme

Farklı uygulamalar
Birden çok sepet içeren bir veri kümesi oluşturun!
my_baskets = data.frame(
"Basket" = c(1,1,1,1, 2,2,2, 3,3, 4,4,4, 5,5, 6,6, 7,7),
"Product" = c("Bread", "Cheese", "Cheese", "Cheese",
"Bread", "Butter", "Wine",
"Butter", "Butter",
"Butter", "Wine", "Wine",
"Butter", "Cheese",
"Cheese", "Wine",
"Wine", "Wine")
)
Sepetlerime kısa bir bakış
head(my_baskets)
Basket Product
1 1 Bread
2 1 Cheese
3 1 Cheese
4 1 Cheese
5 2 Bread
6 2 Butter
Sorular
n_distinct(my_baskets$Product)
[1] 4
n_distinct(my_baskets$Basket)
[1] 7
df_basket =
my_baskets %>%
group_by(Basket) %>%
summarize(
n_total = n(),
n_items = n_distinct(Product))
Basket n_total n_items
<dbl> <int> <int>
1 1 4 2
2 2 3 3
Ortalama sepet boyutları
basket_size %>%
summarize(
avg_total_items = mean(n_total),
avg_dist_items = mean(n_items))
# A tibble: 1 x 2
avg_total_items avg_dist_items
<dbl> <dbl>
1 2.57 1.86
Sepet boyutu dağılımı
# Farklı ürünlerin dağılımı
ggplot(df_basket, aes(n_items)) +
geom_bar()

Hangi ürüne bakıyorsunuz?
Bir ürün tüm sepetlerde kaç kez geçiyor?
Kaç sepet o ürünü içeriyor?
Örnek:

R'de Peynir için filtreleme
# Peynir içeren sepet sayısı
my_baskets %>%
filter(Product == "Cheese") %>%
summarize(
n_tot_items = n(),
n_basket_item = n_distinct(Basket))
n_tot_items n_basket_item
1 5 3
Birliktelik kuralı çıkarımı: bir öğe kümesinde sık birlikte görülen ilişkileri bulma.

Kural çıkarımı örneği:
Kalan dersin gündemi:

R ile Pazar Sepeti Analizi