Visualizzare i cluster

Analisi di cluster in Python

Shaumik Daityari

Business Analyst

Perché visualizzare i cluster?

  • Prova a interpretare i cluster creati
  • Un passo in più per validare i cluster
  • Individua trend nei dati
Analisi di cluster in Python

Introduzione a seaborn

  • seaborn: libreria Python per la visualizzazione basata su matplotlib
  • Estetica migliore e più facile da modificare rispetto a matplotlib
  • Funzioni che semplificano la visualizzazione per l’analisi dei dati
  • Uso nei clustering: parametro hue per i grafici
Analisi di cluster in Python

Visualizzare i cluster con matplotlib

from matplotlib import pyplot as plt
df = pd.DataFrame({'x': [2, 3, 5, 6, 2],
                   'y': [1, 1, 5, 5, 2],
                   'labels': ['A', 'A', 'B', 'B', 'A']})

colors = {'A':'red', 'B':'blue'}
df.plot.scatter(x='x', y='y', c=df['labels'].apply(lambda x: colors[x])) plt.show()
Analisi di cluster in Python

Visualizzare i cluster con seaborn

from matplotlib import pyplot as plt
import seaborn as sns
df = pd.DataFrame({'x': [2, 3, 5, 6, 2],
                   'y': [1, 1, 5, 5, 2],
                   'labels': ['A', 'A', 'B', 'B', 'A']})

sns.scatterplot(x='x', y='y', hue='labels', data=df) plt.show()
Analisi di cluster in Python

Confronto dei due metodi di visualizzazione

grafico matplotlib

grafico seaborn

Analisi di cluster in Python

Prossimo: prova alcune visualizzazioni

Analisi di cluster in Python

Preparing Video For Download...