Studi kasus: kecurangan pemilu

Inferensi untuk Data Kategorik di R

Andrew Bray

Assistant Professor of Statistics at Reed College

Kecurangan pemilu

  • Membeli suara
  • Memilih dua kali
  • Mengubah total suara

4-1-1.png

1 Istilah kecurangan pemilu mencakup banyak hal seperti membeli suara, memilih dua kali di lokasi berbeda, dan memasukkan surat suara palsu ke kotak suara. Kita akan fokus pada bentuk ketiga, saat total suara di TPS tertentu diutak-atik oleh petugas. Sebagai contoh, bayangkan ini adalah total suara di akhir malam di beberapa TPS di kota Anda
Inferensi untuk Data Kategorik di R

Kecurangan pemilu

  • Membeli suara
  • Memilih dua kali
  • Mengubah total suara

4-1-2.png

Inferensi untuk Data Kategorik di R

Hukum Benford (alias “hukum digit pertama”)

library(gapminder)
gapminder %>%
  filter(year == 2007) %>%
  select(country, pop)
# A tibble: 142 x 2
   country           pop
   <fct>           <int>
 1 Afghanistan  31889923
 2 Albania       3600523
 3 Algeria      33333216
 4 Angola       12420476
 5 Argentina    40301927
 6 Australia    20434176
 7 Austria       8199783
 8 Bahrain        708573
 9 Bangladesh  150448339
10 Belgium      10392226
# … with 132 more rows

Plot batang Hukum Benford

Plot populasi negara

Inferensi untuk Data Kategorik di R

Hukum Benford (alias “hukum digit pertama”)

  • Jika pemilu adil, hitungan suara mengikuti Hukum Benford.
  • Jika curang, hitungan suara tidak mengikuti Hukum Benford.

Garis angka digit pertama

Plot batang Hukum Benford

Inferensi untuk Data Kategorik di R

Pemilu Iran 2009

iran %>%
  select(city, ahmadinejad, mousavi, total_votes_cast)
# A tibble: 366 x 4
   city          ahmadinejad mousavi total_votes_cast
   <chr>               <dbl>   <dbl>            <dbl>
 1 Azar Shahr          37203   18312            56712
 2 Asko                32510   18799            52643
 3 Ahar                47938   26220            75500
 4 Bostan Abad         38610   12603            51911
 5 Bonab               36395   33695            71389
 6 Tabriz             435728  419983           876919
 7 Jalfa               20520   14340            35295
 8 Chahar o Imaq       12197    3975            16375
 9 Sarab               53196   17669            72152
10 Shabestar           37099   39182            77459
# … with 356 more rows

Suara Ahmadinejad vs Mousavi

Inferensi untuk Data Kategorik di R

Ayo berlatih!

Inferensi untuk Data Kategorik di R

Preparing Video For Download...