Selecionando colunas

Introdução à Ciência de Dados em Python

Hillary Green-Lerman

Lead Data Scientist, Looker

Por que selecionar colunas?

  • Usar em um cálculo

    credit_records.price.sum()
    
  • Plotar dados

    plt.plot(ransom['letter'], ransom['frequency'])
    
Introdução à Ciência de Dados em Python

Nomes de colunas são strings

print(credit_records.head())
            suspect         location              date         item  price
0    Kirstine Smith   Groceries R Us   January 6, 2018     broccoli   1.25
1      Gertrude Cox  Petroleum Plaza   January 6, 2018  fizzy drink   1.90
2  Fred Frequentist   Groceries R Us   January 6, 2018     broccoli   1.25
3      Gertrude Cox   Groceries R Us  January 12, 2018     broccoli   1.25
4    Kirstine Smith    Clothing Club   January 9, 2018        shirt  14.25
'suspect'
'location'
'date'
'item'
'price'
Introdução à Ciência de Dados em Python

Selecionando com colchetes e string

suspect = credit_records['suspect']
print(suspect)
0            Kirstine Smith
1              Gertrude Cox
2          Fred Frequentist
3              Gertrude Cox
4            Kirstine Smith
5              Gertrude Cox
...
99             Gertrude Cox
100        Fred Frequentist
101            Gertrude Cox
102          Kirstine Smith
103    Ronald Aylmer Fisher
Introdução à Ciência de Dados em Python

Selecionando com ponto

price = credit_records.price
print(price)
0       1.25
1       1.90
2       1.25
3       1.25
4      14.25
5       3.95
...
99     14.25
100    12.05
101    20.15
102     3.95
103     2.05
Introdução à Ciência de Dados em Python

Erros comuns ao selecionar colunas

Use colchetes e string para nomes de colunas com espaço ou caractere especial (-, ?, etc.)

police_report['Is Golden Retriever?']

NÃO

police_report.Is Golden Retriever?
Object `Retriever` not found.
Introdução à Ciência de Dados em Python

Erros comuns ao selecionar colunas

Ao usar colchetes e string, não esquece as aspas no nome da coluna!

credit_report['location']

NÃO

credit_report[location]
Object `location` not found.
Introdução à Ciência de Dados em Python

Erros comuns ao selecionar colunas

Use colchetes, não parênteses

credit_report['location']

NÃO

credit_report('location')
----------------------------------------------------------------------
TypeError  Traceback (most recent call last)
<ipython-input-5-aabdb8981438> in <module>()
----> 1 credit_report('location')

TypeError: 'DataFrame' object is not callable
Introdução à Ciência de Dados em Python

Vamos praticar!

Introdução à Ciência de Dados em Python

Preparing Video For Download...