Dati transazionali

Analisi del carrello in R

Christopher Bruffaerts

Statistician

Cos'è una transazione?

Transazione: attività di acquisto o vendita di qualcosa.

transaction

Dati transazionali: Elenco di tutti gli articoli acquistati da un cliente in un unico acquisto.

Esempio di una transazione:

  TID Product
1   1   Bread
2   1  Cheese
3   1  Cheese
4   1  Cheese
Analisi del carrello in R

La classe transazionale in R

Classe transactions: rappresenta dati di transazione usati per estrarre itemset o regole.

Conversione da:

  • liste
  • matrici
  • dataframe

Prima però devi preparare i dati.

Importante per i dati transazionali

  • Campo/colonna che identifica un prodotto

  • Campo/colonna che identifica una transazione

Analisi del carrello in R

Di nuovo al supermercato (1)

Dati transazionali del negozio

my_transactions = data.frame(
  "TID" = c(1,1,1,1, 2,2,2, 3,3, 4,4,4, 5,5, 6,6, 7,7),
  "Product" = c("Bread", "Cheese", "Cheese", "Cheese",
                "Bread", "Butter", "Wine",
                "Butter", "Butter",
                "Butter", "Wine", "Wine",
                "Butter", "Cheese",
                "Cheese", "Wine",
                "Wine", "Wine")
)

Anteprima delle transazioni

head(my_transactions, 10)
   TID Product
1    1   Bread
2    1  Butter
3    1  Cheese
4    1    Wine
5    2   Bread
6    2  Butter
7    2    Wine
8    3   Bread
9    3  Butter
10   4  Butter
Analisi del carrello in R

Di nuovo al supermercato (2)

Crea liste con la funzione split

# Trasforma TID in un fattore
my_transactions$TID = 
  factor(my_transactions$TID)

# Suddividi in gruppi
data_list = split(my_transactions$Product,
                   my_transactions$TID)
data_list
$`1`
[1] Bread  Butter Cheese Wine  
Levels: Bread Butter Cheese Wine

$`2`
[1] Bread  Butter Wine  
Levels: Bread Butter Cheese Wine

$`3`
[1] Bread  Butter
Levels: Bread Butter Cheese Wine
Analisi del carrello in R

Di nuovo al supermercato (3)

Trasforma in classe transactions

# Trasforma in dataset transazionale
data_trx = as(data_list,"transactions")

# Ispeziona le transazioni
inspect(data_trx)

Ispezione dei dati transazionali

    items                      transactionID
[1] {Bread,Butter,Cheese,Wine} 1            
[2] {Bread,Butter,Wine}        2            
[3] {Bread,Butter}             3            
[4] {Butter,Cheese,Wine}       4            
[5] {Butter,Cheese}            5            
[6] {Cheese,Wine}              6            
[7] {Butter,Wine}              7
Analisi del carrello in R

Altre ispezioni delle transazioni

Panoramica delle transazioni

inspect(head(data_trx))
    items                      transactionID
[1] {Bread,Butter,Cheese,Wine} 1            
[2] {Bread,Butter,Wine}        2            
[3] {Bread,Butter}             3            
[4] {Butter,Cheese,Wine}       4            
[5] {Butter,Cheese}            5            
[6] {Cheese,Wine}              6

Accedi a transazioni specifiche

inspect(data_trx[1])
inspect(data_trx[1:3])

Riepilogo dell'oggetto transazionale

summary(data_trx)
Analisi del carrello in R

Panoramica delle transazioni

Grafico della ItemMatrix

image(data_trx)

Attenzione: usa la funzione su poche transazioni

Utile per identificare:

  • Pattern nelle transazioni
  • Sparsità nei dati

Densità = 18/28 = 0,64

trx_image

Analisi del carrello in R

Ispezioniamo le transazioni!

Analisi del carrello in R

Preparing Video For Download...