Anggaran privasi

Privasi Data dan Anonimisasi di Python

Rebeca Gonzalez

Instructor

Definisi privasi diferensial

  • Cynthia Dwork memperkenalkan privasi diferensial dengan definisi matematis.

Diagram yang menunjukkan keluaran mekanisme privat diferensial pada dasarnya sama, baik seseorang ada di dataset awal atau tidak

  • Epsilon dan akurasi adalah kuantitas terpenting.
Privasi Data dan Anonimisasi di Python

$\epsilon$ parameter privasi

  • Metrik kehilangan privasi
  • Nilai lebih kecil = perlindungan privasi lebih baik
Privasi Data dan Anonimisasi di Python

Anggaran privasi

Gambar kurator data di kiri

Privasi Data dan Anonimisasi di Python

Anggaran privasi

Gambar kurator data di kiri dan pihak ketiga. Sebuah panah mengarah ke kurator data dengan nilai epsilon 1 di atas panah, mewakili kueri ke database

Privasi Data dan Anonimisasi di Python

Anggaran privasi

Gambar kurator data di kiri dan pihak ketiga. Panah lain mengarah ke kurator data dengan nilai epsilon 1 di atas panah, mewakili kueri lain ke database Melakukan kueri privat dengan $\epsilon$ = 1 dua kali sama seperti kueri dengan $\epsilon$ = 2

Privasi Data dan Anonimisasi di Python

Anggaran privasi

Gambar pihak ketiga melakukan perhitungan pada data yang sebelumnya diminta Pihak ketiga dapat merata-ratakan jawaban, menyaring noise.

Privasi Data dan Anonimisasi di Python

Anggaran privasi

  • Batas kehilangan privasi yang boleh ditanggung individu atau kelompok
  • Melacak kueri ke data

Diagram tim melakukan ekstraksi data ke database yang menambahkan noise sebelum menjawab kueri

Privasi Data dan Anonimisasi di Python

Seberapa privat sudah cukup?

  • Kualitasnya bergantung pada kueri dan data
  • Nilai epsilon bisa sangat beragam
Privasi Data dan Anonimisasi di Python

Seberapa privat sudah cukup?

Epsilon $\epsilon$

  • Nilai antara 0 dan 1 sangat baik
  • Nilai di atas 10 buruk
  • Nilai antara 1 dan 10 "lebih baik daripada tidak sama sekali"

Ingat epsilon bersifat eksponensial.

  • Sistem dengan $\epsilon$ = 1 >8.000× lebih privat daripada $\epsilon$ = 10.
Privasi Data dan Anonimisasi di Python

Seberapa privat sudah cukup?

Gambar diagram batang penggunaan emoji di samping logo Apple

1 Tangkapan layar emoji teratas untuk penutur bahasa Inggris AS menurut data yang dikumpulkan Apple.
Privasi Data dan Anonimisasi di Python

Anggaran privasi: cara melacaknya

from diffprivlib import BudgetAccountant

acc = BudgetAccountant(epsilon=5) acc
BudgetAccountant(epsilon=5)
Privasi Data dan Anonimisasi di Python

Anggaran privasi: cara melacaknya

# Compute a private mean of the salaries using epsilon of 0.5
# Use the Budget Accountant acc and set bounds to be from 0 to 230000
dp_mean = tools.mean(salaries, epsilon=0.5, accountant=acc, bounds=(0, 230000))

# Print the resulting private mean print("Private mean: ", dp_mean)
Private mean: 82524.72611901595
Privasi Data dan Anonimisasi di Python

Anggaran privasi: cara melacaknya

# Total privacy spent 
print("Total spent: ", acc.total())

# Privacy budget remaining print("Remaining budget: ", acc.remaining())
# Total number of queries done so far print("Number of queries recorded: ", len(acc))
Total spent: (epsilon=0.5, delta=0.0)

Remaining budget: (epsilon=4.5, delta=1.0)
Number of queries recorded: 1
Privasi Data dan Anonimisasi di Python

Anggaran privasi: cara melacaknya

# Privacy budget remaining for 2 queries
print("Remaining budget for 2 queries: ", acc.remaining(2))
Remaining budget for 2 queries: (epsilon=2.25, delta=1.0)
Privasi Data dan Anonimisasi di Python

Ayo berlatih!

Privasi Data dan Anonimisasi di Python

Preparing Video For Download...