Keterbatasan pengelompokan hierarki

Analisis Klaster di Python

Shaumik Daityari

Business Analyst

Mengukur kecepatan pada pengelompokan hierarki

  • Modul timeit
  • Ukur kecepatan metode .linkage()
  • Gunakan titik acak
  • Jalankan beberapa iterasi untuk ekstrapolasi
Analisis Klaster di Python

Penggunaan modul timeit

from scipy.cluster.hierarchy import linkage
import pandas as pd
import random, timeit

points = 100 df = pd.DataFrame({'x': random.sample(range(0, points), points), 'y': random.sample(range(0, points), points)})
%timeit linkage(df[['x', 'y']], method = 'ward', metric = 'euclidean')
1.02 ms ± 133 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
Analisis Klaster di Python

Perbandingan waktu proses metode linkage

  • Waktu proses naik seiring jumlah titik data
  • Kenaikan waktu berskala kuadrat
  • Tidak layak untuk dataset besar

Analisis Klaster di Python

Berikutnya — latihan

Analisis Klaster di Python

Preparing Video For Download...