Gruppierung (Clustering)

Datenwissenschaft verstehen

Lis Sulmont

Curriculum Manager, DataCamp

Was ist Gruppierung?

clustering.jpg

  • Daten in Kategorien einteilen
  • Anwendungsfälle
    • Kundensegmentierung
    • Bildsegmentierung
    • Anomalieerkennung
Datenwissenschaft verstehen

Überwachtes maschinelles Lernen

 

supervised-learning.jpg

Unüberwachtes maschinelles Lernen

 

unsupervised-learning.jpg

Datenwissenschaft verstehen

Fallstudie: Neue Arten entdecken

$$ Zwei Blumen

Datenwissenschaft verstehen

Wichtigste Merkmale

  • Blumenfarben
  • Blütenblattlänge und -breite
  • Länge und Breite der Kelchblätter
  • Anzahl der Blütenblätter

Blumen mit umrissenen Merkmalen

Datenwissenschaft verstehen

Anzahl der Cluster festlegen

Daten zur Blumenbeobachtung

Datenwissenschaft verstehen

Unterschiedlich viele Gruppen vergleichen

Zwei Gruppen:

Zwei Gruppen

Drei Gruppen:

Drei Gruppen

Datenwissenschaft verstehen

Unterschiedlich viele Gruppen vergleichen

Vier Gruppen:

Vier Cluster

Acht Gruppen:

Acht Cluster

Datenwissenschaft verstehen

Unterschiedlich viele Gruppen vergleichen

  • Die endgültige Anzahl der Cluster bestimmst du selbst
  • Nutze dein Fachwissen, um zu entscheiden
Datenwissenschaft verstehen

Gruppierung – Zusammenfassung

Definition

  • Unbeschrifteten Datensatz in verschiedene Kategorien aufteilen

Schritte

  • Merkmale auswählen
  • Anzahl der Cluster festlegen
  • Cluster zum Lösen von Problemen nutzen
Datenwissenschaft verstehen

Lass uns üben!

Datenwissenschaft verstehen

Preparing Video For Download...