Agrupamiento

Comprender la ciencia de datos

Lis Sulmont

Curriculum Manager, DataCamp

¿Qué es la agrupación?

clustering.jpg

  • Divide los datos en categorías
  • Casos prácticos
    • Segmentación de clientes
    • Segmentación de imágenes
    • Detección de anomalías
Comprender la ciencia de datos

Machine learning supervisado

 

supervised-learning.jpg

Machine learning supervisado

 

unsupervised-learning.jpg

Comprender la ciencia de datos

Caso práctico: descubrir nuevas especies

$$ Dos flores

Comprender la ciencia de datos

Características definitorias

  • Colores de las flores
  • Longitud y anchura de los pétalos
  • Longitud y anchura del sépalo
  • Número de pétalos

Flores con rasgos perfilados

Comprender la ciencia de datos

Definir el número de agrupaciones

Datos de observación de las flores

Comprender la ciencia de datos

Comparación del número de agrupaciones

Dos grupos:

Dos grupos

Tres grupos:

Tres grupos

Comprender la ciencia de datos

Comparación del número de agrupaciones

Cuatro grupos:

Cuatro grupos

Ocho grupos:

Ocho agrupaciones

Comprender la ciencia de datos

Comparación del número de agrupaciones

  • Tú decides el número final de grupos
  • Utilizar el conocimiento del dominio para ayudar a decidir
Comprender la ciencia de datos

Revisión de la agrupación

Definición

  • Divide el conjunto de datos no etiquetados en diferentes categorías

Pasos:

  • Seleccionar características
  • Selecciona el número de grupos
  • Utiliza agrupaciones para resolver problemas
Comprender la ciencia de datos

¡Vamos a practicar!

Comprender la ciencia de datos

Preparing Video For Download...