Visualisierung von Hierarchien

Unsupervised Learning in Python

Benjamin Wilson

Director of Research at lateral.io

Visualisierungen vermitteln Erkenntnisse

  • "t-SNE" : Erstellt eine zweidimensionale Repräsentation eines Datensatzes (wird später behandelt)
  • „Hierarchisches Clustering“ (wird in diesem Video behandelt)
Unsupervised Learning in Python

Eine Hierarchie von Gruppen

  • Gruppen von Lebewesen können eine Hierarchie bilden.
  • Cluster sind ineinander verschachtelt.

 

Hierarchischer Baum der Tiere

Unsupervised Learning in Python

Eurovision-Bewertungsdatensatz

  • Länder haben Songs beim Eurovision Song Contest 2016 bewertet.
  • Zweidimensionales-Array der Punktebewertungen
  • Die Zeilen sind Länder, die Spalten sind Songs.

 

Eurovision-Daten

1 https://www.eurovision.tv/page/results
Unsupervised Learning in Python

Hierarchisches Clustering abstimmender Länder

Eurovision hierarchisches Clustering

Unsupervised Learning in Python

Hierarchisches Clustering

  • Jedes Land ist zu Beginn in einem eigenen Cluster.
  • Bei jedem Schritt werden die beiden Cluster mit der geringsten Distanz zusammengeführt.
  • Bis alle Länder in einem einzigen Cluster vereinigt sind.
  • „Agglomeratives“ hierarchisches Clustering.
Unsupervised Learning in Python

Dendrogramm: hierarchische Clusteranalyse

  • Wird von unten nach oben gelesen
  • Vertikale Linien repräsentieren Cluster

Eurovision hierarchisches Clustering

Unsupervised Learning in Python

Dendrogramm: hierarchische Clusteranalyse

  • Wird von unten nach oben gelesen
  • Vertikale Linien repräsentieren Cluster

Eine Gruppe von Eurovision-Hierarchischem Clustering

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Ein Cluster der hierarchischen Clusterbildung von Eurovision

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Ein Cluster der hierarchischen Clusterbildung der Eurovision mit hervorgehobenem Cluster Griechenland/Zypern

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Ein Cluster der hierarchischen Clusterbildung der Eurovision mit dem Cluster Bulgarien/Griechenland/Zypern hervorgehoben

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Ein Cluster der hierarchischen Clusterbildung der Eurovision mit hervorgehobenem Cluster Moldawien/Russland

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Ein Cluster der hierarchischen Clusterbildung der Eurovision mit dem hervorgehobenen Cluster Moldawien/Russland/Armenien

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Zusammenlegung der Cluster Griechenland/Zypern/Bulgarien mit Moldawien/Russland/Armenien

Unsupervised Learning in Python

Dendrogramme: Schritt für Schritt

Eurovision hierarchisches Clustering

Unsupervised Learning in Python

Hierarchisches Clustering mit SciPy

  • Gegeben ist samples (die Punktetabelle) und country_names
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage, dendrogram

mergings = linkage(samples, method='complete')
dendrogram(mergings, labels=country_names, leaf_rotation=90, leaf_font_size=6) plt.show()
Unsupervised Learning in Python

Lass uns üben!

Unsupervised Learning in Python

Preparing Video For Download...