Memilih kolom

Pengantar Data Science dengan Python

Hillary Green-Lerman

Lead Data Scientist, Looker

Mengapa memilih kolom?

  • Gunakan dalam perhitungan

    credit_records.price.sum()
    
  • Plot data

    plt.plot(ransom['letter'], ransom['frequency'])
    
Pengantar Data Science dengan Python

Nama kolom adalah string

print(credit_records.head())
            suspect         location              date         item  price
0    Kirstine Smith   Groceries R Us   January 6, 2018     broccoli   1.25
1      Gertrude Cox  Petroleum Plaza   January 6, 2018  fizzy drink   1.90
2  Fred Frequentist   Groceries R Us   January 6, 2018     broccoli   1.25
3      Gertrude Cox   Groceries R Us  January 12, 2018     broccoli   1.25
4    Kirstine Smith    Clothing Club   January 9, 2018        shirt  14.25
'suspect'
'location'
'date'
'item'
'price'
Pengantar Data Science dengan Python

Memilih dengan bracket dan string

suspect = credit_records['suspect']
print(suspect)
0            Kirstine Smith
1              Gertrude Cox
2          Fred Frequentist
3              Gertrude Cox
4            Kirstine Smith
5              Gertrude Cox
...
99             Gertrude Cox
100        Fred Frequentist
101            Gertrude Cox
102          Kirstine Smith
103    Ronald Aylmer Fisher
Pengantar Data Science dengan Python

Memilih dengan tanda titik

price = credit_records.price
print(price)
0       1.25
1       1.90
2       1.25
3       1.25
4      14.25
5       3.95
...
99     14.25
100    12.05
101    20.15
102     3.95
103     2.05
Pengantar Data Science dengan Python

Kesalahan umum saat memilih kolom

Gunakan bracket dan string untuk nama kolom dengan spasi atau karakter khusus (-, ?, dll.)

police_report['Is Golden Retriever?']

BUKAN

police_report.Is Golden Retriever?
Objek `Retriever` tidak ditemukan.
Pengantar Data Science dengan Python

Kesalahan umum saat memilih kolom

Saat memakai bracket dan string, jangan lupa tanda kutip di nama kolom!

credit_report['location']

BUKAN

credit_report[location]
Objek `location` tidak ditemukan.
Pengantar Data Science dengan Python

Kesalahan umum saat memilih kolom

Bracket, bukan tanda kurung biasa

credit_report['location']

BUKAN

credit_report('location')
----------------------------------------------------------------------
TypeError  Traceback (most recent call last)
<ipython-input-5-aabdb8981438> in <module>()
----> 1 credit_report('location')

TypeError: 'DataFrame' object is not callable
Pengantar Data Science dengan Python

Ayo berlatih!

Pengantar Data Science dengan Python

Preparing Video For Download...