R ile Pazar Sepeti Analizi
Christopher Bruffaerts
Statistician
İşlem (transaction): Bir şeyin alım satım faaliyeti.

İşlemsel veri: Bir müşterinin tek bir alışverişte satın aldığı tüm ürünlerin listesi.
Bir işlem örneği:
TID Product
1 1 Bread
2 1 Cheese
3 1 Cheese
4 1 Cheese
Transactions sınıfı: öğe kümeleri veya kurallar çıkarmada kullanılan işlem verilerini temsil eder.
Şuradan dönüştürme (coercion):
Ancak önce verinizi hazırlamanız gerekir.
İşlemsel veri için önemli noktalar
Ürünü tanımlayan alan/sütun
İşlemi tanımlayan alan/sütun
Mağazadan işlemsel veriler
my_transactions = data.frame(
"TID" = c(1,1,1,1, 2,2,2, 3,3, 4,4,4, 5,5, 6,6, 7,7),
"Product" = c("Bread", "Cheese", "Cheese", "Cheese",
"Bread", "Butter", "Wine",
"Butter", "Butter",
"Butter", "Wine", "Wine",
"Butter", "Cheese",
"Cheese", "Wine",
"Wine", "Wine")
)
İşlem önizlemesi
head(my_transactions, 10)
TID Product
1 1 Bread
2 1 Butter
3 1 Cheese
4 1 Wine
5 2 Bread
6 2 Butter
7 2 Wine
8 3 Bread
9 3 Butter
10 4 Butter
split işleviyle listeler oluşturma
# TID'i faktöre dönüştürün
my_transactions$TID =
factor(my_transactions$TID)
# Gruplara ayırın
data_list = split(my_transactions$Product,
my_transactions$TID)
data_list
$`1`
[1] Bread Butter Cheese Wine
Levels: Bread Butter Cheese Wine
$`2`
[1] Bread Butter Wine
Levels: Bread Butter Cheese Wine
$`3`
[1] Bread Butter
Levels: Bread Butter Cheese Wine
Transaction sınıfına dönüştürme
# Transactional veri kümesine dönüştürün
data_trx = as(data_list,"transactions")
# İşlemleri inceleyin
inspect(data_trx)
İşlemsel verilerin incelenmesi
items transactionID
[1] {Bread,Butter,Cheese,Wine} 1
[2] {Bread,Butter,Wine} 2
[3] {Bread,Butter} 3
[4] {Butter,Cheese,Wine} 4
[5] {Butter,Cheese} 5
[6] {Cheese,Wine} 6
[7] {Butter,Wine} 7
İşlemlere genel bakış
inspect(head(data_trx))
items transactionID
[1] {Bread,Butter,Cheese,Wine} 1
[2] {Bread,Butter,Wine} 2
[3] {Bread,Butter} 3
[4] {Butter,Cheese,Wine} 4
[5] {Butter,Cheese} 5
[6] {Cheese,Wine} 6
Belirli işlemlere erişim
inspect(data_trx[1])
inspect(data_trx[1:3])
Transaction nesnesinin özeti
summary(data_trx)
ItemMatrix görselleştirme
image(data_trx)
Uyarı: işlevi sınırlı sayıda işlemde kullanın
Şunları belirlemede yararlı:
Yoğunluk = 18/28 = 0.64

R ile Pazar Sepeti Analizi