Kolommen selecteren

Introductie tot Data Science in Python

Hillary Green-Lerman

Lead Data Scientist, Looker

Waarom kolommen selecteren?

  • Gebruik in een berekening

    credit_records.price.sum()
    
  • Data plotten

    plt.plot(ransom['letter'], ransom['frequency'])
    
Introductie tot Data Science in Python

Kolomnamen zijn strings

print(credit_records.head())
            suspect         location              date         item  price
0    Kirstine Smith   Groceries R Us   January 6, 2018     broccoli   1.25
1      Gertrude Cox  Petroleum Plaza   January 6, 2018  fizzy drink   1.90
2  Fred Frequentist   Groceries R Us   January 6, 2018     broccoli   1.25
3      Gertrude Cox   Groceries R Us  January 12, 2018     broccoli   1.25
4    Kirstine Smith    Clothing Club   January 9, 2018        shirt  14.25
'suspect'
'location'
'date'
'item'
'price'
Introductie tot Data Science in Python

Selecteren met brackets en string

suspect = credit_records['suspect']
print(suspect)
0            Kirstine Smith
1              Gertrude Cox
2          Fred Frequentist
3              Gertrude Cox
4            Kirstine Smith
5              Gertrude Cox
...
99             Gertrude Cox
100        Fred Frequentist
101            Gertrude Cox
102          Kirstine Smith
103    Ronald Aylmer Fisher
Introductie tot Data Science in Python

Selecteren met een punt

price = credit_records.price
print(price)
0       1.25
1       1.90
2       1.25
3       1.25
4      14.25
5       3.95
...
99     14.25
100    12.05
101    20.15
102     3.95
103     2.05
Introductie tot Data Science in Python

Veelgemaakte fouten bij kolomselectie

Gebruik brackets en string voor kolomnamen met spaties of speciale tekens (-, ?, etc.)

police_report['Is Golden Retriever?']

NIET

police_report.Is Golden Retriever?
Object `Retriever` niet gevonden.
Introductie tot Data Science in Python

Veelgemaakte fouten bij kolomselectie

Vergeet de aanhalingstekens niet rond de kolomnaam bij gebruik van brackets en string!

credit_report['location']

NIET

credit_report[location]
Object `location` niet gevonden.
Introductie tot Data Science in Python

Veelgemaakte fouten bij kolomselectie

Brackets, geen haakjes

credit_report['location']

NIET

credit_report('location')
----------------------------------------------------------------------
TypeError  Traceback (most recent call last)
<ipython-input-5-aabdb8981438> in <module>()
----> 1 credit_report('location')

TypeError: 'DataFrame' object is niet aanroepbaar
Introductie tot Data Science in Python

Laten we oefenen!

Introductie tot Data Science in Python

Preparing Video For Download...