Il dataset dei voti ONU

Caso di studio: Analisi esplorativa dei dati in R

Dave Robinson

Chief Data Scientist, DataCamp

Dataset voti ONU

rcid session vote ccode
46 2 1 2
46 2 1 20
46 2 9 31
46 2 1 40
46 2 1 41
46 2 1 42
46 2 1 51
46 2 9 52
46 2 9 53
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Dataset voti ONU

rcid session vote ccode
46 2 1 2 Ogni riga è una coppia paese-voto
46 2 1 20
46 2 9 31
46 2 1 40
46 2 1 41
46 2 1 42
46 2 1 51
46 2 9 52
46 2 9 53
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Dataset voti ONU

rcid session vote ccode
46 2 1 2 Ogni riga è una coppia paese-voto
46 2 1 20
46 2 9 31 rcid = "ID appello nominale"
46 2 1 40
46 2 1 41
46 2 1 42
46 2 1 51
46 2 9 52
46 2 9 53
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Dataset voti ONU

rcid session vote ccode
46 2 1 2 Ogni riga è una coppia paese-voto
46 2 1 20
46 2 9 31 rcid = ID appello nominale
46 2 1 40
46 2 1 41 session = Anno sessione
46 2 1 42
46 2 1 51
46 2 9 52
46 2 9 53
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Dataset voti ONU

rcid session vote ccode
46 2 1 2 Ogni riga è una coppia paese-voto
46 2 1 20
46 2 9 31 rcid = ID appello nominale
46 2 1 40
46 2 1 41 session = Anno sessione
46 2 1 42
46 2 1 51 vote = Codice voto
46 2 9 52
46 2 9 53
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Dataset voti ONU

rcid session vote ccode
46 2 1 2 Ogni riga è una coppia paese-voto
46 2 1 20
46 2 9 31 rcid = ID appello nominale
46 2 1 40
46 2 1 41 session = Anno sessione
46 2 1 42
46 2 1 51 vote = Codice voto
46 2 9 52
46 2 9 53 ccode = Codice paese
1 Erik Voeten, "Data and Analyses of Voting in the UN General Assembly"
Caso di studio: Analisi esplorativa dei dati in R

Voti in dplyr

# Load dplyr package
library(dplyr)
votes
# A tibble: 508,929 × 4
    rcid session  vote ccode
   <dbl>   <dbl> <dbl> <int>
1     46       2     1     2
2     46       2     1    20
3     46       2     9    31
4     46       2     1    40
5     46       2     1    41
6     46       2     1    42
7     46       2     9    51
8     46       2     9    52
9     46       2     9    53
10    46       2     9    54
# ... with 508,919 more rows

Nomi variabili

Caso di studio: Analisi esplorativa dei dati in R

L'operatore pipe

1-1.014.png

Caso di studio: Analisi esplorativa dei dati in R

L'operatore pipe

1-1.015.png

Caso di studio: Analisi esplorativa dei dati in R

Verbi dplyr

1-1.018.png

Caso di studio: Analisi esplorativa dei dati in R

Verbi dplyr

1-1.020.png

Caso di studio: Analisi esplorativa dei dati in R

Dati originali

votes
# A tibble: 508,929 × 4
    rcid session  vote ccode
   <dbl>   <dbl> <dbl> <int>
1     46       2     1     2
2     46       2     1    20
3     46       2     9    31
4     46       2     1    40
5     46       2     1    41
6     46       2     1    42
7     46       2     9    51
8     46       2     9    52
9     46       2     9    53
10    46       2     9    54
# ... with 508,919 more rows
1 = Sì
2 = Astenuto
3 = No
8 = Assente
9 = Non membro
Caso di studio: Analisi esplorativa dei dati in R

Verbi dplyr: filter

filter mantiene le osservazioni in base a una condizione

votes %>%
  filter(vote <= 3)
# A tibble: 353,547 × 4
    rcid session  vote ccode
   <dbl>   <dbl> <dbl> <int>
1     46       2     1     2
2     46       2     1    20
3     46       2     1    40
4     46       2     1    41
5     46       2     1    42
6     46       2     1    70
7     46       2     1    90
8     46       2     1    91
9     46       2     1    92
10    46       2     1    93
# ... with 508,919 more rows
Caso di studio: Analisi esplorativa dei dati in R

Verbi dplyr: mutate

mutate aggiunge una variabile

votes %>%
  mutate(year = session + 1945)
# A tibble: 508,929 × 5
    rcid session  vote ccode  year
   <dbl>   <dbl> <dbl> <int> <dbl>
1     46       2     1     2  1947
2     46       2     1    20  1947
3     46       2     9    31  1947
4     46       2     1    40  1947
5     46       2     1    41  1947
6     46       2     1    42  1947
7     46       2     9    51  1947
8     46       2     9    52  1947
9     46       2     9    53  1947
10    46       2     9    54  1947
# ... with 508,919 more rows
Caso di studio: Analisi esplorativa dei dati in R

Collegare operazioni nel data cleaning

1-1.033.png

Caso di studio: Analisi esplorativa dei dati in R

Passiamo alla pratica !

Caso di studio: Analisi esplorativa dei dati in R

Preparing Video For Download...