Agrupamento

Introdução à ciência de dados

Lis Sulmont

Curriculum Manager, DataCamp

O que é clustering?

clustering.jpg

  • Dividir os dados em categorias
  • Casos de uso
    • Segmentação de clientes
    • Segmentação de imagens
    • Detecção de anomalias
Introdução à ciência de dados

Aprendizado de máquina supervisionado

 

supervised-learning.jpg

Aprendizado de máquina não supervisionado

 

unsupervised-learning.jpg

Introdução à ciência de dados

Estudo de caso: descobrindo novas espécies

() Duas flores

Introdução à ciência de dados

Definição de recursos

  • Cores das flores
  • Comprimento e largura das pétalas
  • Comprimento e largura da sépala
  • Número de pétalas

Flores com características delineadas

Introdução à ciência de dados

Definição do número de clusters

Dados de observação de flores

Introdução à ciência de dados

Comparação do número de clusters

Dois agrupamentos:

Dois clusters

Três grupos:

Três clusters

Introdução à ciência de dados

Comparação do número de clusters

Quatro grupos:

Quatro clusters

Oito grupos:

Oito clusters

Introdução à ciência de dados

Comparação do número de clusters

  • Cabe a você decidir o número final de clusters
  • Usar o conhecimento do domínio para ajudar você a decidir
Introdução à ciência de dados

Análise de agrupamento

Definição

  • Dividir o conjunto de dados não rotulados em diferentes categorias

Etapas:

  • Selecionar recursos
  • Selecione o número de clusters
  • Usar clusters para resolver problemas
Introdução à ciência de dados

Vamos praticar!

Introdução à ciência de dados

Preparing Video For Download...