Grafico a coordinate parallele

Analisi del carrello in Python

Isaiah Hull

Visiting Associate Professor of Finance, BI Norwegian Business School

Cos’è un grafico a coordinate parallele?

Il grafico mostra un esempio di coordinate parallele con il dataset MovieLens.

Analisi del carrello in Python

Quando usare i grafici a coordinate parallele

 

  • Coordinate parallele vs heatmap.
    • Non serve l’intensità.
    • Vuoi solo sapere se la regola esiste.
    • Vuoi ridurre il disordine visivo.

 

  • Coordinate parallele vs scatterplot.
    • Vuoi info sulla singola regola.
    • Non t’interessano più metriche.
    • Vuoi solo esaminare le regole finali.
Analisi del carrello in Python

Preparare i dati

 

from mlxtend.frequent_patterns import association_rules, apriori

# Load the one-hot encoded data
onehot = pd.read_csv('datasets/movies_onehot.csv')
# Generate frequent itemsets
frequent_itemsets = apriori(onehot, min_support = 0.10, use_colnames = True, max_len = 2)

# Generate association rules
rules = association_rules(frequent_itemsets, metric = 'support', min_threshold = 0.00)
Analisi del carrello in Python

Convertire le regole in coordinate

# Convert rules to coordinates.
rules['antecedent'] = rules['antecedents'].apply(lambda antecedent: list(antecedent)[0])
rules['consequent'] = rules['consequents'].apply(lambda consequent: list(consequent)[0])
rules['rule'] = rules.index
# Define coordinates and label
coords = rules[['antecedent','consequent','rule']]

# Print example
print(coords.head(1))
                antecedent        consequent  rule
0  Dark Knight, The (2008)  Inception (2010)     0
Analisi del carrello in Python

Creare un grafico a coordinate parallele

 

from pandas.plotting import parallel_coordinates

# Generate parallel coordinates plot
parallel_coordinates(coords, 'rule', colormap = 'ocean')
Analisi del carrello in Python

Creare un grafico a coordinate parallele

La figura mostra un grafico a coordinate parallele con i dati MovieLens.

Analisi del carrello in Python

Rifinire un grafico a coordinate parallele

# Generate frequent itemsets
frequent_itemsets = apriori(onehot, min_support = 0.01, use_colnames = True, max_len = 2)

# Generate association rules
rules = association_rules(frequent_itemsets, metric = 'lift', min_threshold = 1.00)

# Generate coordinates and print example
coords = rules_to_coordinates(rules)

# Generate parallel coordinates plot
parallel_coordinates(coords, 'rule')
Analisi del carrello in Python

Rifinire un grafico a coordinate parallele

La figura mostra un grafico a coordinate parallele con i dati MovieLens.

Analisi del carrello in Python

Passiamo alla pratica!

Analisi del carrello in Python

Preparing Video For Download...