Analisi del carrello in R
Christopher Bruffaerts
Statistician
Transazione: attività di acquisto o vendita di qualcosa.

Dati transazionali: Elenco di tutti gli articoli acquistati da un cliente in un unico acquisto.
Esempio di una transazione:
TID Product
1 1 Bread
2 1 Cheese
3 1 Cheese
4 1 Cheese
Classe transactions: rappresenta dati di transazione usati per estrarre itemset o regole.
Conversione da:
Prima però devi preparare i dati.
Importante per i dati transazionali
Campo/colonna che identifica un prodotto
Campo/colonna che identifica una transazione
Dati transazionali del negozio
my_transactions = data.frame(
"TID" = c(1,1,1,1, 2,2,2, 3,3, 4,4,4, 5,5, 6,6, 7,7),
"Product" = c("Bread", "Cheese", "Cheese", "Cheese",
"Bread", "Butter", "Wine",
"Butter", "Butter",
"Butter", "Wine", "Wine",
"Butter", "Cheese",
"Cheese", "Wine",
"Wine", "Wine")
)
Anteprima delle transazioni
head(my_transactions, 10)
TID Product
1 1 Bread
2 1 Butter
3 1 Cheese
4 1 Wine
5 2 Bread
6 2 Butter
7 2 Wine
8 3 Bread
9 3 Butter
10 4 Butter
Crea liste con la funzione split
# Trasforma TID in un fattore
my_transactions$TID =
factor(my_transactions$TID)
# Suddividi in gruppi
data_list = split(my_transactions$Product,
my_transactions$TID)
data_list
$`1`
[1] Bread Butter Cheese Wine
Levels: Bread Butter Cheese Wine
$`2`
[1] Bread Butter Wine
Levels: Bread Butter Cheese Wine
$`3`
[1] Bread Butter
Levels: Bread Butter Cheese Wine
Trasforma in classe transactions
# Trasforma in dataset transazionale
data_trx = as(data_list,"transactions")
# Ispeziona le transazioni
inspect(data_trx)
Ispezione dei dati transazionali
items transactionID
[1] {Bread,Butter,Cheese,Wine} 1
[2] {Bread,Butter,Wine} 2
[3] {Bread,Butter} 3
[4] {Butter,Cheese,Wine} 4
[5] {Butter,Cheese} 5
[6] {Cheese,Wine} 6
[7] {Butter,Wine} 7
Panoramica delle transazioni
inspect(head(data_trx))
items transactionID
[1] {Bread,Butter,Cheese,Wine} 1
[2] {Bread,Butter,Wine} 2
[3] {Bread,Butter} 3
[4] {Butter,Cheese,Wine} 4
[5] {Butter,Cheese} 5
[6] {Cheese,Wine} 6
Accedi a transazioni specifiche
inspect(data_trx[1])
inspect(data_trx[1:3])
Riepilogo dell'oggetto transazionale
summary(data_trx)
Grafico della ItemMatrix
image(data_trx)
Attenzione: usa la funzione su poche transazioni
Utile per identificare:
Densità = 18/28 = 0,64

Analisi del carrello in R