Kaç küme?

Python ile Kümeleme Analizi

Shaumik Daityari

Business Analyst

Doğru k nasıl bulunur?

  • k-means kümelemede doğru küme sayısını (k) bulmak için mutlak bir yöntem yoktur
  • Dirsek yöntemi

Python ile Kümeleme Analizi

Bozulmalara yeniden bakış

  • Bozulma: noktaların küme merkezlerine kareli uzaklıklarının toplamı
  • Küme sayısı arttıkça azalır
  • Küme sayısı nokta sayısına eşit olduğunda sıfır olur
  • Dirsek grafiği: küme sayısı ile bozulma arasındaki çizgi grafik

Python ile Kümeleme Analizi

Dirsek yöntemi

  • Dirsek grafiği: küme sayısı ile bozulmanın grafiği
  • Dirsek grafiği, verideki küme sayısını belirtmeye yardımcı olur
Python ile Kümeleme Analizi

Python ile dirsek yöntemi

# Declaring variables for use
distortions = []

num_clusters = range(2, 7)
# Populating distortions for various clusters
for i in num_clusters:
    centroids, distortion = kmeans(df[['scaled_x', 'scaled_y']], i)
    distortions.append(distortion)
# Plotting elbow plot data
elbow_plot_data = pd.DataFrame({'num_clusters': num_clusters,
                                'distortions': distortions})

sns.lineplot(x='num_clusters', y='distortions', 
             data = elbow_plot_data)
plt.show()
Python ile Kümeleme Analizi

Python ile Kümeleme Analizi

Dirsek yöntemine dair son notlar

  • Yalnızca en uygun k (küme sayısı) için bir gösterge sağlar
  • Her zaman k (küme sayısı) değerini net vermez
  • Diğer yöntemler: ortalama siluet ve boşluk istatistiği
Python ile Kümeleme Analizi

Sırada: alıştırmalar

Python ile Kümeleme Analizi

Preparing Video For Download...