k-means kümelemenin sınırlamaları

Python ile Kümeleme Analizi

Shaumik Daityari

Business Analyst

k-means kümelemenin sınırlamaları

  • Doğru _K_ (küme sayısı) nasıl bulunur?
  • Tohumların etkisi
  • Eşit boyutlu kümelere eğilim
Python ile Kümeleme Analizi

Tohumların etkisi

Rastgele tohum başlatma

from numpy import random
random.seed(12)

Tohum: np.array(1000, 2000)

Küme boyutları: 29, 29, 43, 47, 52

 

Tohum: np.array(1,2,3)

Küme boyutları: 26, 31, 40, 50, 53

Python ile Kümeleme Analizi

Tohumların etkisi: grafikler

Tohum: np.array(1000, 2000)

Tohum: np.array(1,2,3)

Python ile Kümeleme Analizi

k-means’te tekdüze kümeler

Python ile Kümeleme Analizi

k-means’te tekdüze kümeler: karşılaştırma

3 küme ile k-means kümeleme

3 küme ile hiyerarşik kümeleme

Python ile Kümeleme Analizi

Son düşünceler

  • Her tekniğin artı ve eksileri vardır
  • Algoritma seçmeden önce veri boyutu ve örüntüleri değerlendirin
  • Kümeleme, analizin keşif aşamasıdır
Python ile Kümeleme Analizi

Sırada: alıştırmalar

Python ile Kümeleme Analizi

Preparing Video For Download...