Birden çok özellik ile kümeleme

Python ile Kümeleme Analizi

Shaumik Daityari

Business Analyst

Temel kontroller

# Küme merkezleri
print(fifa.groupby('cluster_labels')[['scaled_heading_accuracy', 
    'scaled_volleys', 'scaled_finishing']].mean())
cluster_labels scaled_heading_accuracy scaled_volleys scaled_finishing
0 3.21 2.83 2.76
1 0.71 0.64 0.58
# Küme boyutları
print(fifa.groupby('cluster_labels')['ID'].count())
cluster_labels count
0 886
1 114
Python ile Kümeleme Analizi

Görselleştirmeler

  • Küme merkezlerini görselleştirin
  • Her küme için diğer değişkenleri görselleştirin

 

# Küme merkezlerini çiz
fifa.groupby('cluster_labels') \
  [scaled_features].mean()
  .plot(kind='bar')
plt.show()

Python ile Kümeleme Analizi

Kümelerdeki en iyi öğeler

# Her kümedeki ilk 5 oyuncunun adını alın
for cluster in fifa['cluster_labels'].unique():
    print(cluster, fifa[fifa['cluster_labels'] == cluster]['name'].values[:5])
Küme Etiketi En İyi Oyuncular
0 ['Cristiano Ronaldo' 'L. Messi' 'Neymar' 'L. Suárez' 'R. Lewandowski']
1 ['M. Neuer' 'De Gea' 'G. Buffon' 'T. Courtois' 'H. Lloris']
Python ile Kümeleme Analizi

Özellik azaltma

  • Faktör analizi
  • Çok boyutlu ölçekleme
Python ile Kümeleme Analizi

Final alıştırmalar!

Python ile Kümeleme Analizi

Preparing Video For Download...