Analisis Keranjang Belanja di R
Christopher Bruffaerts
Statistician
Kursus Market Basket

Keranjang = kumpulan item
Item

Contoh keranjang:
Keranjang Anda di supermarket
Keranjang belanja Amazon Anda
Kursus Anda di DataCamp
Film yang Anda tonton di Netflix
Apa saja yang ada di toko?

Apa yang akan Anda beli hari ini?

Apa saja yang ada di toko?
store = c("Bread", "Butter",
"Cheese", "Wine")
set.seed(1234)
n_items = 4
my_basket = data.frame(
TID = rep(1,n_items),
Product = sample(
store, n_items,
replace = TRUE))
Keluaran R
my_basket
TID Product
1 1 Bread
2 1 Cheese
3 1 Cheese
4 1 Cheese
Keranjang asli saya
Satu catatan per item yang dibeli
TID Product
1 1 Bread
2 1 Cheese
3 1 Cheese
4 1 Cheese
Keranjang yang disesuaikan
Satu catatan per item unik yang dibeli
# A tibble: 2 x 3
TID Product Quantity
<dbl> <fct> <int>
1 1 Bread 1
2 1 Cheese 3
Membentuk ulang data keranjang
# Menyesuaikan keranjang
my_basket = my_basket %>%
add_count(Product) %>%
unique() %>%
rename(Quantity = n)
# Jumlah item unik
n_distinct(my_basket$Product)
2
# Total ukuran keranjang
my_basket %>% summarize(sum(Quantity))
4
Memvisualisasikan item dalam keranjang
# Plot item
ggplot(my_basket,
aes(x=reorder(Product, Quantity),
y = Quantity)) +
geom_col() +
coord_flip() +
xlab("Items") +
ggtitle("Ringkasan item
dalam keranjang saya")

Pertanyaan: Adakah hubungan antar item dalam satu keranjang?

Kembali ke contoh
Keranjang Anda di supermarket, mis. Spageti dan Saus tomat
Keranjang belanja Amazon Anda, mis. Ponsel dan casing ponsel
Kursus Anda di DataCamp mis. "Introduction to R" dan "Intermediate R"
Analisis Keranjang Belanja di R