Introductie market basket

Market Basket-analyse in R

Christopher Bruffaerts

Statistician

Overzicht

Market Basket-cursus

  • Hoofdstuk 1: Introductie tot market basket-analyse
  • Hoofdstuk 2: Metrieken en technieken in market basket-analyse
  • Hoofdstuk 3: Visualisatie in market basket-analyse
  • Hoofdstuk 4: Casestudy: Filmaanbevelingen @ MovieLens

movie_lens_logo

Market Basket-analyse in R

Wat is een mandje?

Mandje = verzameling items

Items

  1. Producten in de supermarkt
  2. Producten op een website
  3. DataCamp-cursussen
  4. Films bekeken door gebruikers

supermarkt

Voorbeelden van mandjes:

  1. Je mandje in de supermarkt

  2. Je Amazon-winkelwagen

  3. Je cursussen op DataCamp

  4. De films die je op Netflix hebt gekeken

Market Basket-analyse in R

Voorbeeld supermarkt

Wat is er in de winkel?

alle_producten_emoticons

Waar heb je vandaag zin in?

  • Eén brood
  • Drie stukken kaas

brood_3kaas

Market Basket-analyse in R

Supermarktvoorbeeld in R

Wat is er in de winkel?

store = c("Bread", "Butter",
          "Cheese", "Wine")
set.seed(1234)
n_items = 4
my_basket = data.frame(
                TID = rep(1,n_items),
                Product = sample(
                    store, n_items, 
                    replace = TRUE))

R-uitvoer

my_basket
  TID Product
1   1   Bread
2   1  Cheese
3   1  Cheese
4   1  Cheese
Market Basket-analyse in R

Wat zit er in mijn mandje?

Mijn originele mandje

Eén record per gekocht item

  TID Product
1   1   Bread
2   1  Cheese
3   1  Cheese
4   1  Cheese

Mijn aangepaste mandje

Eén record per uniek gekocht item

# A tibble: 2 x 3
    TID Product Quantity
  <dbl> <fct>      <int>
1     1 Bread          1
2     1 Cheese         3
Market Basket-analyse in R

Wat zit er in mijn R-mandje?

De mandgegevens reshapen

# Mijn mandje aanpassen
my_basket = my_basket %>%
                add_count(Product) %>%
                unique() %>% 
                rename(Quantity = n)
# Aantal unieke items
n_distinct(my_basket$Product)
2
# Totale mandgrootte
my_basket %>% summarize(sum(Quantity))
4
Market Basket-analyse in R

Items in mijn mandje visualiseren

Items in mijn mandje visualiseren

# Items plotten 
ggplot(my_basket,
    aes(x=reorder(Product, Quantity),
        y = Quantity)) +
          geom_col() +
        coord_flip() +
        xlab("Items") +
        ggtitle("Samenvatting van items
                in mijn mandje")

verdeling_mand_brood_kaas

Market Basket-analyse in R

Waarom kijken we naar mijn mandje?

Vraag: Is er een relatie tussen items binnen een mandje?

mandjes

Terug naar de voorbeelden

  1. Je mandje in de supermarkt, bijv. spaghetti en tomatensaus

  2. Je Amazon-winkelwagen, bijv. telefoon en hoesje

  3. Je cursussen op DataCamp bijv. "Introduction to R" en "Intermediate R"

Market Basket-analyse in R

Veel shopplezier!

Market Basket-analyse in R

Preparing Video For Download...