Geniş veriden uzun veriye

tidyr ile Veriyi Şekillendirme

Jeroen Boeye

Head of Machine Learning, Faktion

 

separate()

Birden çok değişken içeren sütun

Değişken başına bir sütun

 

separate_rows()

Birden çok değer içeren hücre

Hücre başına bir değer

tidyr ile Veriyi Şekillendirme

Sütun başlıklarında değerler

nuke_df
# A tibble: 2 x 6
  country            `1945` `1946` `1948` `1949` `1951`
  <chr>               <int>  <int>  <int>  <int>  <int>
1 United States           3      2      3     NA     16
2 Russian Federation     NA     NA     NA      1      2
tidyr ile Veriyi Şekillendirme

Sütun başlıklarında değerler

Başlık olarak değişkenler

Düzenli: başlık değil değişkenler

tidyr ile Veriyi Şekillendirme

pivot_longer() işlevi

nuke_df %>% 
  pivot_longer(`1945`:`1951`)
# A tibble: 10 x 3
   country            name  value
   <chr>              <chr> <int>
 1 United States      1945      3
 2 United States      1946      2
 3 United States      1948      3
 4 United States      1949     NA
 5 United States      1951     16
 6 Russian Federation 1945     NA
 # ... 4 satır daha
tidyr ile Veriyi Şekillendirme

pivot_longer() işlevi

nuke_df %>% 
  pivot_longer(c(`1945`, `1946`, `1948`, `1949`, `1951`))
# A tibble: 10 x 3
   country            name  value
   <chr>              <chr> <int>
 1 United States      1945      3
 2 United States      1946      2
 3 United States      1948      3
 4 United States      1949     NA
 5 United States      1951     16
 6 Russian Federation 1945     NA
 # ... 4 satır daha
tidyr ile Veriyi Şekillendirme

pivot_longer() işlevi

nuke_df %>% 
  pivot_longer(-country)
# A tibble: 10 x 3
   country            name  value
   <chr>              <chr> <int>
 1 United States      1945      3
 2 United States      1946      2
 3 United States      1948      3
 4 United States      1949     NA
 5 United States      1951     16
 6 Russian Federation 1945     NA
 # ... 4 satır daha
tidyr ile Veriyi Şekillendirme

pivot_longer() bağımsız değişkenleri

nuke_df %>% 
  pivot_longer(-country, names_to = "year", values_to = "n_bombs")
# A tibble: 10 x 3
   country            year  n_bombs
   <chr>              <chr> <int>
 1 United States      1945      3
 2 United States      1946      2
 3 United States      1948      3
 4 United States      1949     NA
 5 United States      1951     16
 6 Russian Federation 1945     NA
 # ... 4 satır daha
tidyr ile Veriyi Şekillendirme

pivot_longer() bağımsız değişkenleri

nuke_df %>% 
  pivot_longer(
    -country, 
    names_to = "year", 
    values_to = "n_bombs", 
    values_drop_na = TRUE
  )
# A tibble: 6 x 3
  country            year  n_bombs
  <chr>              <chr>   <int>
1 United States      1945        3
2 United States      1946        2
3 United States      1948        3
4 United States      1951       16
5 Russian Federation 1949        1
6 Russian Federation 1951        2
tidyr ile Veriyi Şekillendirme

pivot_longer() bağımsız değişkenleri

nuke_df %>% 
  pivot_longer(
    -country, 
    names_to = "year", 
    values_to = "n_bombs", 
    values_drop_na = TRUE,
    names_transform = list(year = as.integer)
  )
# A tibble: 6 x 3
  country             year n_bombs
  <chr>              <int>   <int>
1 United States       1945       3
2 United States       1946       2
3 United States       1948       3
4 United States       1951      16
5 Russian Federation  1949       1
6 Russian Federation  1951       2
tidyr ile Veriyi Şekillendirme

Haydi pratik yapalım!

tidyr ile Veriyi Şekillendirme

Preparing Video For Download...