Python ile Ayrık Olay Benzetimi
Diogo Costa (PhD, MSc)
Adjunct Professor, University of Saskatchewan, Canada & CEO of ImpactBLUE-Scientific
Histogram
Matplotlib paketi
import matplotlib.pyplot as plt
Kullanım: data veri kümesi için 50 kutucuklu histogram oluşturun
plt.hist(data, bins=50)


Makine öğrenmesi

Ayrık olaylı modellerde
Odak noktamız
Gözlemler ve küme centroidleri

SciPy yöntemi
scipy.cluster.vq.kmeans()
Uygulama
import scipy
scipy.cluster.vq.kmeans(
obs, k_or_guess, iter=20, thresh=1e-05,
check_finite=True, *, seed=None)
obs bir numpy dizisidirk-means öncesi: Beyazlatma (whitening)
obs verisini dekorrele edinobs boyutlarını standart sapmasıyla yeniden ölçekleyin
SciPy'da
scipy.cluster.vq.whiten(
obs, check_finite=True)
obs bir numpy dizisidirProcess 1 etkisini inceleyelimDNT_CURLY_TAG_2

Paketi içe aktarın
import scipy.cluster.vq as scvq
Model sonuçlarını beyazlatın
white_data = scvq.whiten(model_results)
2 küme bulun (mavi noktalar)
cluster_centroids, distortion =
scvq.kmeans(white_data, 2)
Teknikler
Basit yöntem
nobs = gözlem sayısınum_clusters =
int((model_results.shape[0]/2)**0.5)
22
from sklearn.metrics import silhouette_score
k küme sayıları için silüet skorlarını hesaplayın
for k in range(2, 6):
model = KMeans(n_clusters=k)
model.fit(model_results)
pred = model.predict(model_results)
score = silhouette_score(model_results, pred)
Konsol çıktısı
Silhouette Score for k = 2: 0.591
Silhouette Score for k = 3: 0.472
Silhouette Score for k = 4: 0.381
Silhouette Score for k = 5: 0.364
Silhouette Score for k = 6: 0.373
Sonuçları yorumlayın
score = 1score = -1score 0'a yakınPython ile Ayrık Olay Benzetimi