Scatterplots

Market Basket Analysis in Python

Isaiah Hull

Visiting Associate Professor of Finance, BI Norwegian Business School

Introductie tot scatterplots

De figuur toont een voorbeeld van een scatterplot.

Market Basket Analysis in Python

Introductie tot scatterplots

  • Een scatterplot toont waardeparen.
    • Antecedent- en consequent-steun.
    • Confidence en lift.
  • Geen model verondersteld.
    • Geen trendlijn of curve nodig.
  • Kan startpunt zijn voor snoeien.
    • Vind patronen in data en regels.
Market Basket Analysis in Python

Support versus confidence

Dit toont een scatterplot van support versus confidence in regels gegenereerd voor de MovieLens-dataset.

Market Basket Analysis in Python

Support versus confidence

Dit toont een scatterplot van support versus confidence in regels gegenereerd voor de MovieLens-dataset.

1 Bayardo Jr., R.J. and Agrawal, R. (1999). Mining the Most Interesting Rules. In Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 145-154).
Market Basket Analysis in Python

Een scatterplot maken

import pandas as pd
import seaborn as sns
from mlxtend.frequent_patterns import association_rules, apriori

# Load one-hot encoded MovieLens data
onehot = pd.read_csv('datasets/movies_onehot.csv')
# Generate frequent itemsets using Apriori
frequent_itemsets = apriori(onehot, min_support=0.01, use_colnames=True, max_len=2)

# Generate association rules
rules = association_rules(frequent_itemsets, metric='support', min_threshold=0.0)
sns.scatterplot(x="antecedent support", y="consequent support", data=rules)
Market Basket Analysis in Python

Een scatterplot maken

Deze figuur toont een scatterplot van antecedent-steun tegen consequent-steun.

Market Basket Analysis in Python

Een derde maat toevoegen

 

sns.scatterplot(x="antecedent support", 
                y="consequent support", 
                size="lift", 
                data=rules)
Market Basket Analysis in Python

Een derde maat toevoegen

Deze scatterplot toont de relatie tussen antecedent-steun, consequent-steun en lift.

Market Basket Analysis in Python

Wat leren we van scatterplots?

  • Vind natuurlijke drempels in data.
    • Niet mogelijk met heatmaps of andere visuals.
  • Visualiseer de hele dataset.
    • Niet beperkt tot weinig regels.
  • Gebruik bevindingen om te snoeien.
    • Snoei op basis van drempels en patronen.
Market Basket Analysis in Python

Laten we oefenen!

Market Basket Analysis in Python

Preparing Video For Download...