Pengenalan DataFrame

Manipulasi Data dengan pandas

Richie Cotton

Data Evangelist at DataCamp

Apa gunanya panda?

Manipulasi Data dengan pandas

Garis besar kursus

  • Bab 1: DataFrames
    • Mengurutkan dan melakukan subset
    • Membuat kolom baru
  • Bab 2: Penggabungan Data
    • Statistik ringkasan
    • Penghitungan
    • Statistik ringkasan yang dikelompokkan
  • Bab 3: Mengiris dan Pengindeksan Data

    • Pembuatan subset dengan mengiris
    • Pengindeksan dan pembuatan subset menggunakan indeks
  • Bab 4: Membuat dan Menampilkan Data

    • Pembuatan grafik
    • Penanganan data yang hilang
    • Membaca data ke dalam DataFrame
Manipulasi Data dengan pandas

pandas dibangun di atas NumPy dan Matplotlib.

Sebuah segitiga bertumpu di atas dua persegi panjang. Segitiga mewakili paket pandas, sedangkan persegi panjang mewakili paket NumPy dan matplotlib.

Manipulasi Data dengan pandas

pandas sangat populer.

Emoji panda yang diulang ratusan kali, mewakili banyaknya pengguna panda.

1 https://pypistats.org/packages/pandas
Manipulasi Data dengan pandas

Data persegi panjang

Nama Ras Warna Tinggi (cm) Berat badan (kg) Tanggal Lahir
Bella Labrador Brown 56 25 01-07-2013
Charlie Poodle Hitam 43 23 16-09-2016
Lucy Chow Chow Brown 46 22 25-08-2014
Cooper Schnauzer Gray 49 17 11-12-2011
Max Labrador Hitam 59 29 20-01-2017
Stella Chihuahua Tan 18 2 20-04-2015
Bernie St. Bernard Putih 77 74 27-02-2018
Manipulasi Data dengan pandas

DataFrame pandas

print(dogs)
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56         24    2013-07-01
1  Charlie       Poodle  Black         43         24    2016-09-16
2     Lucy    Chow Chow  Brown         46         24    2014-08-25
3   Cooper    Schnauzer   Gray         49         17    2011-12-11
4      Max     Labrador  Black         59         29    2017-01-20
5   Stella    Chihuahua    Tan         18          2    2015-04-20
6   Bernie  St. Bernard  White         77         74    2018-02-27
Manipulasi Data dengan pandas

Mengeksplorasi DataFrame: .head()

print(dogs.head())
      name        breed  color  height_cm  weight_kg date_of_birth
0    Bella     Labrador  Brown         56         24    2013-07-01
1  Charlie       Poodle  Black         43         24    2016-09-16
2     Lucy    Chow Chow  Brown         46         24    2014-08-25
3   Cooper    Schnauzer   Gray         49         17    2011-12-11
4      Max     Labrador  Black         59         29    2017-01-20
Manipulasi Data dengan pandas

Mengeksplorasi DataFrame: .info()

print(dogs.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 6 columns):
 #   Column         Non-Null Count  Dtype 
 --  ------         --------------  ----- 
 0   name           7 non-null      object
 1   breed          7 non-null      object
 2   color          7 non-null      object
 3   height_cm      7 non-null      int64 
 4   weight_kg      7 non-null      int64 
 5   date_of_birth  7 non-null      object
dtypes: int64(2), object(4)
memory usage: 464.0+ bytes
Manipulasi Data dengan pandas

Mengeksplorasi DataFrame: .shape

print(dogs.shape)
(7, 6)
Manipulasi Data dengan pandas

Mengeksplorasi DataFrame: .describe()

print(dogs.describe())
       height_cm  weight_kg
count   7.000000   7.000000
mean   49.714286  27.428571
std    17.960274  22.292429
min    18.000000   2.000000
25%    44.500000  19.500000
50%    49.000000  23.000000
75%    57.500000  27.000000
max    77.000000  74.000000
Manipulasi Data dengan pandas

Komponen DataFrame: .values

print(dogs.values)
array([['Bella', 'Labrador', 'Brown', 56, 24, '2013-07-01'],
       ['Charlie', 'Poodle', 'Black', 43, 24, '2016-09-16'],
       ['Lucy', 'Chow Chow', 'Brown', 46, 24, '2014-08-25'],
       ['Cooper', 'Schnauzer', 'Gray', 49, 17, '2011-12-11'],
       ['Max', 'Labrador', 'Black', 59, 29, '2017-01-20'],
       ['Stella', 'Chihuahua', 'Tan', 18, 2, '2015-04-20'],
       ['Bernie', 'St. Bernard', 'White', 77, 74, '2018-02-27']],
      dtype=object)
Manipulasi Data dengan pandas

Komponen DataFrame: .columns dan .index

print(dogs.columns)
Index(['name', 'breed', 'color', 'height_cm', 'weight_kg', 'date_of_birth'],
dtype='object')
dogs.index
RangeIndex(start=0, stop=7, step=1)
Manipulasi Data dengan pandas

Filosofi Pandas

Harus ada satu — dan sebaiknya hanya satu — cara yang jelas untuk melakukannya.

     - Zen of Python oleh Tim Peters, Poin 13

Sebuah pisau Swiss Army berwarna hijau

1 https://www.python.org/dev/peps/pep-0020/
Manipulasi Data dengan pandas

Ayo berlatih!

Manipulasi Data dengan pandas

Preparing Video For Download...