Clusteranalyse in Python
Shaumik Daityari
Business Analyst
scipy.cluster.hierarchy.linkage(observations,
method='single',
metric='euclidean',
optimal_ordering=False
)
method: hoe de nabijheid van clusters wordt berekendmetric: afstandsmaatoptimal_ordering: volgorde van datapunten'single': gebaseerd op twee dichtstbijzijnde objecten'complete': gebaseerd op twee verst uit elkaar liggende objecten'average': gebaseerd op het rekenkundig gemiddelde van alle objecten'centroid': gebaseerd op het meetkundig gemiddelde van alle objecten'median': gebaseerd op de mediaan van alle objecten'ward': gebaseerd op de som van kwadratenscipy.cluster.hierarchy.fcluster(distance_matrix,
num_clusters,
criterion
)
distance_matrix: output van linkage()num_clusters: aantal clusterscriterion: hoe drempels worden bepaald om clusters te vormen


Clusteranalyse in Python