Dataprivacy en anonimisering in Python
Rebeca Gonzalez
Instructor



Twee keer dezelfde privéquery met $\epsilon$ = 1 doen is gelijk aan één query met privacy $\epsilon$ = 2
Derden kunnen antwoorden middelen en zo de ruis wegfilteren.

Onthoud: epsilon werkt exponentieel.

from diffprivlib import BudgetAccountantacc = BudgetAccountant(epsilon=5) acc
BudgetAccountant(epsilon=5)
# Bereken een privé gemiddelde van salarissen met epsilon = 0.5 # Gebruik de Budget Accountant acc en stel bounds in van 0 tot 230000 dp_mean = tools.mean(salaries, epsilon=0.5, accountant=acc, bounds=(0, 230000))# Print het resulterende privé gemiddelde print("Private mean: ", dp_mean)
Private mean: 82524.72611901595
# Totale verbruikte privacy print("Total spent: ", acc.total())# Resterend privacybudget print("Remaining budget: ", acc.remaining())# Totaal aantal queries tot nu toe print("Number of queries recorded: ", len(acc))
Total spent: (epsilon=0.5, delta=0.0)Remaining budget: (epsilon=4.5, delta=1.0)Number of queries recorded: 1
# Resterend privacybudget voor 2 queries
print("Remaining budget for 2 queries: ", acc.remaining(2))
Remaining budget for 2 queries: (epsilon=2.25, delta=1.0)
Dataprivacy en anonimisering in Python