Introductie tot differential privacy

Dataprivacy en anonimisering in Python

Rebeca Gonzalez

Instructor

Wat is differential privacy (DP)?

Verf jij je haar?

$$ $$ Afbeelding van een hand die naar een van twee knoppen wijst en de knop met een vinkje selecteert

Tekening van blonde vrouw

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Afbeelding van een munt

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Diagram van een munt die naar het woord kop wijst aan een van de takken, links

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Diagram van een munt die naar kop wijst aan een van de takken, links. Daarna gevolgd door de zin "echte antwoord"

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Diagram van een munt die naar kop staat aan de rechterkant van de takken.

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Diagram van een munt die naar munt staat aan de rechterkant van de takken. Gevolgd door opties kop en munt

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Diagram van een munt die naar munt staat aan de rechterkant van de takken. Gevolgd door opties kop en munt. Kop eindigt met "nee" en munt met "ja"

Dataprivacy en anonimisering in Python

Wat is differential privacy (DP)?

Differential privacy is een wiskundige definitie van privacy.

Tekening van een gezicht in tweeën gedeeld. De rechterkant heeft een vraagteken

Dataprivacy en anonimisering in Python

Wie gebruikt differential privacy (DP)?

Logo van Apple

Dataprivacy en anonimisering in Python

Wie gebruikt differential privacy (DP)?

Apples emoji-trefwoorden

Apple-logo

Dataprivacy en anonimisering in Python

Globale differential privacy

  • Betrouwbare beheerder beschermt data
  • Ruis toegevoegd aan de output

Diagram van globale differential privacy

Dataprivacy en anonimisering in Python

Lokale differential privacy

  • Geen vertrouwde partij.
  • Ruis toevoegen vóór delen.

Diagram van lokale differential privacy

Dataprivacy en anonimisering in Python

Epsilon-differential privacy

Griekse letter epsilon $\epsilon$: hoe privé en hoe ruis een datavrijgave is.

  • Hogere waarden van $\epsilon$ geven nauwkeuriger en minder privé data
  • Lage $\epsilon$-systemen geven sterk gerandomiseerde data
Dataprivacy en anonimisering in Python

Epsilon is exponentieel

Bijv. $\epsilon$ = 1.

$\epsilon^1=2.72$

  • Bijna drie keer zo privé als $\epsilon$ = 2.
    • $\epsilon^2=7.39$
  • En meer dan 8.000× zo privé als $\epsilon$ = 10.
    • $\epsilon^10=22000$
Dataprivacy en anonimisering in Python

K-anonimiteit en differential privacy

k-anonimiteit biedt "syntactische" garanties

  • Nog breed gebruikt
  • Vaak niet toereikend

Differential privacy is het huidige de facto-privacymodel

  • Voorkeur bij bedrijven: Apple, Uber, Google
  • Privacydegradatie van releases is exact te kwantificeren
Dataprivacy en anonimisering in Python

Introductie tot diffprivlib

diffprivlib v0.3 van IBM

IBM-logo

Dataprivacy en anonimisering in Python

Histogrammen

# Get counts and bars for non-private histogram of salaries
counts, bins = np.histogram(salaries)


# Normalize counts to get proportions of the height proportions = counts / counts.sum()
# Draw the histogram of proportions plt.bar(bins[:-1], height=proportions, width=(bins[1] - bins[0])) plt.show()
Dataprivacy en anonimisering in Python

Histogrammen

Resulterend niet-privé histogram

Dataprivacy en anonimisering in Python

Privé-histogram

import diffprivlib.tools

# Get counts and bars for private histogram of salaries with epsilon of 0.1 dp_counts, dp_bins = tools.histogram(salaries, epsilon=0.1)
# Normalize counts to get proportions dp_proportions = dp_counts / dp_counts.sum()
# Draw the histogram of proportions and see differences plt.bar(dp_bins[:-1], dp_proportions, width=(dp_bins[1] - dp_bins[0])) plt.show()
Dataprivacy en anonimisering in Python

Privé-histogram

Niet-privé histogram Resulterend niet-privé histogram

Resulterend privé-histogram Resulterend privé-histogram

Dataprivacy en anonimisering in Python

Laten we oefenen!

Dataprivacy en anonimisering in Python

Preparing Video For Download...