Dataprivacy en anonimisering in Python
Rebeca Gonzalez
Data engineer



from diffprivlib.models import KMeans# Clusters berekenen met het DP‑model model = KMeans(epsilon=1, n_clusters=3)# Run het model en verkrijg clusters clusters = model.fit_predict(X)
StandardScaler en dimensiereductie zoals PCA.diffprivlib doe je dit net zoals met sklearn-modellen.from sklearn.decomposition import PCA# Initialiseer PCA pca = PCA()# Pas PCA toe op de data X = pca.fit_transform(X)# Clusters berekenen met het DP‑model model = dp_Kmeans(epsilon=1, n_clusters=3)# Run het model en verkrijg clusters clusters = model.fit_predict(X)



from diffprivlib.models import KMeans as model# Clusters berekenen met het DP‑model model = dp_Kmeans(epsilon=0.2, n_clusters=3)# Run het model en verkrijg clusters clusters = model.fit_predict(X)

Dataprivacy en anonimisering in Python