Visualizar jerarquías

Aprendizaje no supervisado en Python

Benjamin Wilson

Director of Research at lateral.io

Las visualizaciones comunican ideas

  • «t-SNE»: crea un mapa 2D del conjunto de datos (más adelante)
  • «Clustering jerárquico» (este video)
Aprendizaje no supervisado en Python

Una jerarquía de grupos

  • Los seres vivos pueden formar una jerarquía
  • Los clústeres se contienen unos a otros

 

Árbol jerárquico de animales

Aprendizaje no supervisado en Python

Conjunto de datos de puntuaciones de Eurovisión

  • Los países dieron puntuaciones a las canciones de Eurovisión 2016
  • Array 2D de puntuaciones
  • Filas: países; columnas: canciones

 

Datos de Eurovisión

1 https://www.eurovision.tv/page/results
Aprendizaje no supervisado en Python

Clustering jerárquico de los países votantes

Clustering jerárquico de Eurovisión

Aprendizaje no supervisado en Python

Clustering jerárquico

  • Cada país empieza en un clúster aparte
  • En cada paso, se fusionan los dos clústeres más cercanos
  • Continúa hasta un único clúster con todos los países
  • Esto es clustering jerárquico «aglomerativo»
Aprendizaje no supervisado en Python

El dendrograma de un clustering jerárquico

  • Lee de abajo arriba
  • Las líneas verticales representan clústeres

Clustering jerárquico de Eurovisión

Aprendizaje no supervisado en Python

El dendrograma de un clustering jerárquico

  • Lee de abajo arriba
  • Las líneas verticales representan clústeres

Un clúster del clustering jerárquico de Eurovisión

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Un clúster del clustering jerárquico de Eurovisión

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Un clúster del clustering jerárquico de Eurovisión con el clúster Grecia/Chipre resaltado

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Un clúster del clustering jerárquico de Eurovisión con el clúster Bulgaria/Grecia/Chipre resaltado

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Un clúster del clustering jerárquico de Eurovisión con el clúster Moldavia/Rusia resaltado

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Un clúster del clustering jerárquico de Eurovisión con el clúster Moldavia/Rusia/Armenia resaltado

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Fusión del clúster Grecia/Chipre/Bulgaria con Moldavia/Rusia/Armenia

Aprendizaje no supervisado en Python

Dendrogramas, paso a paso

Clustering jerárquico de Eurovisión

Aprendizaje no supervisado en Python

Clustering jerárquico con SciPy

  • Dados samples (el array de puntuaciones) y country_names
import matplotlib.pyplot as plt
from scipy.cluster.hierarchy import linkage, dendrogram

mergings = linkage(samples, method='complete')
dendrogram(mergings, labels=country_names, leaf_rotation=90, leaf_font_size=6) plt.show()
Aprendizaje no supervisado en Python

¡Vamos a practicar!

Aprendizaje no supervisado en Python

Preparing Video For Download...