Python ile Veri Gizliliği ve Anonimleştirme
Rebeca Gonzalez
Data engineer



"Sosyal ve yasal normları karşılayan bilgi akışlarını sağlama yetisi."

Tek başına veya başka verilerle birlikte bir kişiyi tanımlayabilen veriler.



Tek başına bir kişiye ulaşmak için kullanılamayan veriler
Cinsiyet, meslek, posta kodu veya doğum ili/şehri gibi, tek başına bir kişiye ulaşmak için kullanılamayan veriler.

Avrupa’da yaşayanların veya verisi Avrupa’da işlenenlerin PII’sini korur.

Konu gizliliğini korumak için seçili bilgileri kaldırma.
# Hassas PII "name" üzerinde öznitelik bastırma suppressed_salaries = salaries.drop('name', axis="columns")# Elde edilen veri setini inceleyin suppressed_salaries.head()
gender status salary pay_basis position_title
0 Male Employee 64400.0 Per Annum DEPUTY DIRECTOR
1 Male Employee 43600.0 Per Annum ASSOCIATE DIRECTOR
2 Male Employee 120000.0 Per Annum SPECIAL ASSISTANT TO THE PRESIDENT AND DEPUTY ...
3 Male Employee 86200.0 Per Annum LEAD ADVANCE REPRESENTATIVE
4 Male Employee 106000.0 Per Annum SPECIAL ASSISTANT TO THE PRESIDENT AND DIRECTO...
# DataFrame'i inceleyin
salaries.head()
hours performance salary
0 72 51 $80,500.00
1 20 99 $2,805,000.00
3 75 62 $75,800.00
4 74 58 $60,000.00
5 70 54 $79,000.00
# 2.000.000'dan yüksek maaşlı satırları düşürün
salaries = salaries.drop(salaries[salaries.Salary > 2000000].index)
# Ortaya çıkan DataFrame'i görün
salaries.head()
hours performance salary
0 72 51 80500
2 75 62 75800
3 74 58 60000
4 70 54 79000
5 68 53 62000

Python ile Veri Gizliliği ve Anonimleştirme