Clustering

Comprendre la science des données

Lis Sulmont

Curriculum Manager, DataCamp

Qu'est-ce que le regroupement ?

clustering.jpg

  • Classez les données en catégories
  • Cas d’utilisation
    • Segmentation de la clientèle
    • Segmentation d'image
    • Détection des anomalies
Comprendre la science des données

Machine learning supervisé

 

supervised-learning.jpg

Machine learning non supervisé

 

unsupervised-learning.jpg

Comprendre la science des données

Études de cas : découverte de nouvelles espèces

$$ Two flowers

Comprendre la science des données

Caractéristiques distinctives

  • Couleurs des fleurs
  • Longueur et largeur des pétales
  • Longueur et largeur du sépale
  • Nombre de pétales

Flowers with features outlined

Comprendre la science des données

Définition du nombre de groupes

Flower observation data

Comprendre la science des données

Comparaison du nombre de groupes

Deux groupes :

Two clusters

Trois groupes :

Three clusters

Comprendre la science des données

Comparaison du nombre de groupes

Quatre groupes :

Four clusters

Huit groupes :

Eight clusters

Comprendre la science des données

Comparaison du nombre de groupes

  • C'est à vous de décider du nombre final de groupes
  • Utilisez vos connaissances du domaine pour prendre des décisions éclairées
Comprendre la science des données

Examen des regroupements

Définition

  • Divisez un ensemble de données non étiquetées en différentes catégories

Étapes

  • Sélectionnez les fonctionnalités
  • Veuillez sélectionner le nombre de groupes
  • Utilisez des groupes pour résoudre les problèmes
Comprendre la science des données

Passons à la pratique !

Comprendre la science des données

Preparing Video For Download...