Visualisation des hiérarchies

Apprentissage non supervisé en Python

Benjamin Wilson

Director of Research at lateral.io

Les visualisations transmettent des informations pertinentes

  • "t-SNE" : Crée une carte 2D d'un ensemble de données (ultérieurement)
  • « Regroupement hiérarchique » (cette vidéo)
Apprentissage non supervisé en Python

Une hiérarchie de groupes

  • Les groupes d'êtres vivants peuvent former une hiérarchie
  • Les clusters sont imbriqués les uns dans les autres

 

Hierarchical tree of animals

Apprentissage non supervisé en Python

Ensemble de données sur le système de notation de l'Eurovision

  • Les pays ont attribué des notes aux chansons interprétées lors de l'Eurovision 2016
  • Tableau 2D de scores
  • Les lignes représentent les pays, les colonnes représentent les chansons

 

Eurovision data

1 https://www.eurovision.tv/page/results
Apprentissage non supervisé en Python

Regroupement hiérarchique des pays votants

Eurovision hierarchical clustering

Apprentissage non supervisé en Python

Regroupement hiérarchique

  • Chaque pays commence dans un groupe distinct
  • À chaque étape, les deux groupes les plus proches sont fusionnés
  • Continuer jusqu'à ce que tous les pays soient dans un seul groupe
  • Il s'agit d'un regroupement hiérarchique « agglomératif »
Apprentissage non supervisé en Python

Le dendrogramme d'un regroupement hiérarchique

  • Lire de bas en haut
  • Les lignes verticales représentent des groupes

Eurovision hierarchical clustering

Apprentissage non supervisé en Python

Le dendrogramme d'un regroupement hiérarchique

  • Lire de bas en haut
  • Les lignes verticales représentent des groupes

One cluster of Eurovision hierarchical clustering

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

One cluster of Eurovision hierarchical clustering

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

One cluster of Eurovision hierarchical clustering with Greece/Cyprus cluster highlighted

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

One cluster of Eurovision hierarchical clustering with Bulgaria/Greece/Cyprus cluster highlighted

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

One cluster of Eurovision hierarchical clustering with Moldova/Russia cluster highlighted

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

One cluster of Eurovision hierarchical clustering with Moldova/Russia/Armenia cluster highlighted

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

Merging of Greece/Cyprus/Bulgaria cluster with Moldova/Russia?Armenia

Apprentissage non supervisé en Python

Dendrogrammes, étape par étape

Eurovision hierarchical clustering

Apprentissage non supervisé en Python

Regroupement hiérarchique avec SciPy

  • Étant donné samples (le tableau des scores), et country_names
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage, dendrogram

mergings = linkage(samples, method='complete')
dendrogram(mergings, labels=country_names, leaf_rotation=90, leaf_font_size=6) plt.show()
Apprentissage non supervisé en Python

Passons à la pratique !

Apprentissage non supervisé en Python

Preparing Video For Download...