Caso di studio: brogli elettorali

Inferenza per dati categorici in R

Andrew Bray

Assistant Professor of Statistics at Reed College

Brogli elettorali

  • Acquisto di voti
  • Voto doppio
  • Alterazione dei totali

Esempio 1

1 L’espressione brogli elettorali può indicare molte cose: comprare voti, votare due volte in luoghi diversi e riempire le urne con schede false. Qui ci concentriamo sulla terza: quando i totali in un seggio vengono alterati dagli scrutatori. Per esempio, immagina che questi siano i totali a fine serata in vari seggi della tua città
Inferenza per dati categorici in R

Brogli elettorali

  • Acquisto di voti
  • Voto doppio
  • Alterazione dei totali

Esempio 2

Inferenza per dati categorici in R

Legge di Benford, alias “legge della prima cifra”

library(gapminder)
gapminder %>%
  filter(year == 2007) %>%
  select(country, pop)
# A tibble: 142 x 2
   country           pop
   <fct>           <int>
 1 Afghanistan  31889923
 2 Albania       3600523
 3 Algeria      33333216
 4 Angola       12420476
 5 Argentina    40301927
 6 Australia    20434176
 7 Austria       8199783
 8 Bahrain        708573
 9 Bangladesh  150448339
10 Belgium      10392226
# … with 132 more rows

Barre: legge di Benford

Barre: popolazione per paese

Inferenza per dati categorici in R

Legge di Benford, alias “legge della prima cifra”

  • Se l’elezione è corretta, i voti seguono la legge di Benford.
  • Se ci sono brogli, i voti non seguono la legge di Benford.

Linea dei numeri per la prima cifra

Barre: legge di Benford

Inferenza per dati categorici in R

Iran: elezioni 2009

iran %>%
  select(city, ahmadinejad, mousavi, total_votes_cast)
# A tibble: 366 x 4
   city          ahmadinejad mousavi total_votes_cast
   <chr>               <dbl>   <dbl>            <dbl>
 1 Azar Shahr          37203   18312            56712
 2 Asko                32510   18799            52643
 3 Ahar                47938   26220            75500
 4 Bostan Abad         38610   12603            51911
 5 Bonab               36395   33695            71389
 6 Tabriz             435728  419983           876919
 7 Jalfa               20520   14340            35295
 8 Chahar o Imaq       12197    3975            16375
 9 Sarab               53196   17669            72152
10 Shabestar           37099   39182            77459
# … with 356 more rows

Ahmadinejad vs. Mousavi

Inferenza per dati categorici in R

Passons à la pratique !

Inferenza per dati categorici in R

Preparing Video For Download...