Introduzione al market basket

Analisi del carrello in R

Christopher Bruffaerts

Statistician

Panoramica

Corso Market Basket

  • Capitolo 1: Introduzione alla market basket analysis
  • Capitolo 2: Metriche e tecniche nella market basket analysis
  • Capitolo 3: Visualizzazione nella market basket analysis
  • Capitolo 4: Caso di studio: consigli di film su MovieLens

movie_lens_logo

Analisi del carrello in R

Cos’è un carrello?

Carrello = insieme di articoli

Articoli

  1. Prodotti al supermercato
  2. Prodotti su siti online
  3. Corsi DataCamp
  4. Film visti dagli utenti

supermercato

Esempi di carrelli:

  1. Il tuo carrello al supermercato

  2. Il tuo carrello Amazon

  3. I tuoi corsi su DataCamp

  4. I film che hai visto su Netflix

Analisi del carrello in R

Esempio supermercato

Cosa c’è in negozio?

tutti_prodotti_emoji

Cosa prendi oggi?

  • Un pane
  • Tre pezzi di formaggio

pane_3formaggi

Analisi del carrello in R

Esempio supermercato in R

Cosa c’è in negozio?

store = c("Bread", "Butter",
          "Cheese", "Wine")
set.seed(1234)
n_items = 4
my_basket = data.frame(
                TID = rep(1,n_items),
                Product = sample(
                    store, n_items, 
                    replace = TRUE))

Output R

my_basket
  TID Product
1   1   Bread
2   1  Cheese
3   1  Cheese
4   1  Cheese
Analisi del carrello in R

Cosa c’è nel mio carrello?

Il mio carrello originale

Un record per ogni articolo acquistato

  TID Product
1   1   Bread
2   1  Cheese
3   1  Cheese
4   1  Cheese

Il mio carrello adattato

Un record per ogni articolo distinto acquistato

# A tibble: 2 x 3
    TID Product Quantity
  <dbl> <fct>      <int>
1     1 Bread          1
2     1 Cheese         3
Analisi del carrello in R

Cosa c’è nel mio carrello in R?

Rimodellare i dati del carrello

# Adjusting my basket
my_basket = my_basket %>%
                add_count(Product) %>%
                unique() %>% 
                rename(Quantity = n)
# Numero di articoli distinti
n_distinct(my_basket$Product)
2
# Dimensione totale del carrello
my_basket %>% summarize(sum(Quantity))
4
Analisi del carrello in R

Visualizzare gli articoli nel carrello

Visualizzare gli articoli nel carrello

# Plotting items 
ggplot(my_basket,
    aes(x=reorder(Product, Quantity),
        y = Quantity)) +
          geom_col() +
        coord_flip() +
        xlab("Items") +
        ggtitle("Summary of items
                in my basket")

distribuzione_carrello_pane_formaggio

Analisi del carrello in R

Perché guardiamo il mio carrello?

Domanda: C’è relazione tra gli articoli nello stesso carrello?

carrelli

Torniamo agli esempi

  1. Il tuo carrello al supermercato, e.g. Spaghetti e salsa di pomodoro

  2. Il tuo carrello Amazon, e.g. Telefono e cover

  3. I tuoi corsi su DataCamp e.g. "Introduction to R" e "Intermediate R"

Analisi del carrello in R

Buono shopping!

Analisi del carrello in R

Preparing Video For Download...