Grafici a dispersione

Analisi del carrello in Python

Isaiah Hull

Visiting Associate Professor of Finance, BI Norwegian Business School

Introduzione agli scatterplot

La figura mostra un esempio di scatterplot.

Analisi del carrello in Python

Introduzione agli scatterplot

  • Uno scatterplot mostra coppie di valori.
    • Supporto di antecedente e conseguente.
    • Confidenza e lift.
  • Nessun modello presupposto.
    • Nessuna linea o curva di trend richiesta.
  • Punto di partenza per la potatura.
    • Individua pattern in dati e regole.
Analisi del carrello in Python

Supporto vs confidenza

Questo mostra uno scatterplot di supporto vs confidenza nelle regole generate per il dataset MovieLens.

Analisi del carrello in Python

Supporto vs confidenza

Questo mostra uno scatterplot di supporto vs confidenza nelle regole generate per il dataset MovieLens.

1 Bayardo Jr., R.J. and Agrawal, R. (1999). Mining the Most Interesting Rules. In Proceedings of the Fifth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (pp. 145-154).
Analisi del carrello in Python

Creare uno scatterplot

import pandas as pd
import seaborn as sns
from mlxtend.frequent_patterns import association_rules, apriori

# Load one-hot encoded MovieLens data
onehot = pd.read_csv('datasets/movies_onehot.csv')
# Generate frequent itemsets using Apriori
frequent_itemsets = apriori(onehot, min_support=0.01, use_colnames=True, max_len=2)

# Generate association rules
rules = association_rules(frequent_itemsets, metric='support', min_threshold=0.0)
sns.scatterplot(x="antecedent support", y="consequent support", data=rules)
Analisi del carrello in Python

Creare uno scatterplot

Questo grafico mostra uno scatterplot del supporto dell'antecedente rispetto a quello del conseguente.

Analisi del carrello in Python

Aggiungere una terza metrica

 

sns.scatterplot(x="antecedent support", 
                y="consequent support", 
                size="lift", 
                data=rules)
Analisi del carrello in Python

Aggiungere una terza metrica

Questo scatterplot mostra la relazione tra supporto dell'antecedente, supporto del conseguente e lift.

Analisi del carrello in Python

Cosa impariamo dagli scatterplot?

  • Individua soglie naturali nei dati.
    • Non possibile con heatmap o altre visualizzazioni.
  • Visualizza l'intero dataset.
    • Non limitato a poche regole.
  • Usa i risultati per potare.
    • Pota con soglie e pattern naturali.
Analisi del carrello in Python

Let's practice!

Analisi del carrello in Python

Preparing Video For Download...