Menggunakan merge_ordered()

Menggabungkan Data dengan pandas

Aaren Stubberfield

Instructor

merge_ordered()

Contoh tabel merge_ordered()

Menggabungkan Data dengan pandas

Perbandingan metode

Metode .merge():

  • Kolom untuk menggabungkan
    • on, left_on, dan right_on
  • Jenis join
    • how (left, right, inner, outer) {{@}}
    • bawaan inner
  • Nama kolom tumpang tindih
    • suffixes
  • Memanggil metode
    • df1.merge(df2)

Fungsi merge_ordered():

  • Kolom untuk menggabungkan
    • on, left_on, dan right_on
  • Jenis join
    • how (left, right, inner, outer)
    • bawaan outer
  • Nama kolom tumpang tindih
    • suffixes
  • Memanggil fungsi
    • pd.merge_ordered(df1, df2)
Menggabungkan Data dengan pandas

Dataset keuangan

Gambar koran dengan grafik Dow Jones

1 Foto oleh Markus Spiske di Unsplash
Menggabungkan Data dengan pandas

Data saham

Nama tabel: aapl

  date        close    
0 2007-02-01  12.087143
1 2007-03-01  13.272857
2 2007-04-01  14.257143
3 2007-05-01  17.312857
4 2007-06-01  17.434286

Nama tabel: mcd

  date        close    
0 2007-01-01  44.349998
1 2007-02-01  43.689999
2 2007-03-01  45.049999
3 2007-04-01  48.279999
4 2007-05-01  50.549999
Menggabungkan Data dengan pandas

Menggabungkan data saham

import pandas as pd
pd.merge_ordered(aapl, mcd, on='date', suffixes=('_aapl','_mcd'))
  date        close_aapl  close_mcd
0 2007-01-01  NaN         44.349998
1 2007-02-01  12.087143   43.689999
2 2007-03-01  13.272857   45.049999
3 2007-04-01  14.257143   48.279999
4 2007-05-01  17.312857   50.549999
5 2007-06-01  17.434286   NaN
Menggabungkan Data dengan pandas

Forward fill

Gambar sebelum-sesudah forward fill. Nilai hilang di kolom diisi dengan nilai sebelumnya di kolom itu.

Menggabungkan Data dengan pandas

Contoh forward fill

pd.merge_ordered(aapl, mcd, on='date', 
                 suffixes=('_aapl','_mcd'), 
                 fill_method='ffill')
  date        close_aapl  close_mcd
0 2007-01-01  NaN         44.349998
1 2007-02-01  12.087143   43.689999
2 2007-03-01  13.272857   45.049999
3 2007-04-01  14.257143   48.279999
4 2007-05-01  17.312857   50.549999
5 2007-06-01  17.434286   50.549999
pd.merge_ordered(aapl, mcd, on='date', 
                 suffixes=('_aapl','_mcd'))
  date        close_aapl  close_mcd
0 2007-01-01  NaN         44.349998
1 2007-02-01  12.087143   43.689999
2 2007-03-01  13.272857   45.049999
3 2007-04-01  14.257143   48.279999
4 2007-05-01  17.312857   50.549999
5 2007-06-01  17.434286   NaN
Menggabungkan Data dengan pandas

Kapan memakai merge_ordered()?

  • Data terurut / deret waktu
  • Mengisi nilai hilang
Menggabungkan Data dengan pandas

Ayo berlatih!

Menggabungkan Data dengan pandas

Preparing Video For Download...