Spalten auswählen

Einführung in Data Science mit Python

Hillary Green-Lerman

Lead Data Scientist, Looker

Warum Spalten auswählen?

  • In einer Berechnung

    credit_records.price.sum()
    
  • Daten plotten

    plt.plot(ransom['letter'], ransom['frequency'])
    
Einführung in Data Science mit Python

Spaltennamen sind strings

print(credit_records.head())
            suspect         location              date         item  price
0    Kirstine Smith   Groceries R Us   January 6, 2018     broccoli   1.25
1      Gertrude Cox  Petroleum Plaza   January 6, 2018  fizzy drink   1.90
2  Fred Frequentist   Groceries R Us   January 6, 2018     broccoli   1.25
3      Gertrude Cox   Groceries R Us  January 12, 2018     broccoli   1.25
4    Kirstine Smith    Clothing Club   January 9, 2018        shirt  14.25
'suspect'
'location'
'date'
'item'
'price'
Einführung in Data Science mit Python

Auswahl mit Klammern und Zeichenfolgen

suspect = credit_records['suspect']
print(suspect)
0            Kirstine Smith
1              Gertrude Cox
2          Fred Frequentist
3              Gertrude Cox
4            Kirstine Smith
5              Gertrude Cox
...
99             Gertrude Cox
100        Fred Frequentist
101            Gertrude Cox
102          Kirstine Smith
103    Ronald Aylmer Fisher
Einführung in Data Science mit Python

Auswahl mit einem Punkt

price = credit_records.price
print(price)
0       1.25
1       1.90
2       1.25
3       1.25
4      14.25
5       3.95
...
99     14.25
100    12.05
101    20.15
102     3.95
103     2.05
Einführung in Data Science mit Python

Häufige Fehler bei der Auswahl von Spalten

Verwende eckige Klammern und strings für Spaltennamen mit Leerzeichen oder Sonderzeichen (-, ? usw.).

police_report['Is Golden Retriever?']

NOT

police_report.Is Golden Retriever?
Object `Retriever` not found.
Einführung in Data Science mit Python

Häufige Fehler bei der Auswahl von Spalten

Wenn du Klammern und Zeichenfolgen verwendest, vergiss nicht die Anführungszeichen um den Spaltennamen!

credit_report['location']

NOT

credit_report[location]
Object `location` not found.
Einführung in Data Science mit Python

Häufige Fehler bei der Auswahl von Spalten

Eckige Klammern, keine runden Klammern

credit_report['location']

NOT

credit_report('location')
----------------------------------------------------------------------
TypeError  Traceback (most recent call last)
<ipython-input-5-aabdb8981438> in <module>()
----> 1 credit_report('location')

TypeError: 'DataFrame' object is not callable
Einführung in Data Science mit Python

Lass uns üben!

Einführung in Data Science mit Python

Preparing Video For Download...