Simulazione a eventi discreti in Python
Diogo Costa (PhD, MSc)
Adjunct Professor, University of Saskatchewan, Canada & CEO of ImpactBLUE-Scientific
Istogramma
Pacchetto Matplotlib
import matplotlib.pyplot as plt
Uso: crea un istogramma del dataset data con 50 bin
plt.hist(data, bins=50)


Machine learning

Nei modelli a eventi discreti
Focus
Osservazioni e centroidi

Metodo SciPy
scipy.cluster.vq.kmeans()
Implementazione
import scipy
scipy.cluster.vq.kmeans(
obs, k_or_guess, iter=20, thresh=1e-05,
check_finite=True, *, seed=None)
obs è un array numpyPrima di eseguire k-means: Whitening
obsobs per la sua deviazione standard
In SciPy
scipy.cluster.vq.whiten(
obs, check_finite=True)
obs è un array numpyProcess 1
Importa pacchetto
import scipy.cluster.vq as scvq
Whitening dei risultati
white_data = scvq.whiten(model_results)
Trova 2 cluster (punti blu)
cluster_centroids, distortion =
scvq.kmeans(white_data, 2)
Tecniche
Metodo semplice
nobs = numero di osservazioninum_clusters =
int((model_results.shape[0]/2)**0.5)
22
from sklearn.metrics import silhouette_score
Calcola i punteggi silhouette per k cluster
for k in range(2, 6):
model = KMeans(n_clusters=k)
model.fit(model_results)
pred = model.predict(model_results)
score = silhouette_score(model_results, pred)
Output console
Silhouette Score for k = 2: 0.591
Silhouette Score for k = 3: 0.472
Silhouette Score for k = 4: 0.381
Silhouette Score for k = 5: 0.364
Silhouette Score for k = 6: 0.373
Interpreta i risultati
score = 1score = -1score vicino a 0Simulazione a eventi discreti in Python