Introdução a outros tipos de arquivo

Introdução à importação de dados em Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Outros tipos de arquivo

  • Planilhas do Excel
  • Arquivos MATLAB
  • Arquivos SAS
  • Arquivos Stata
  • Arquivos HDF5
Introdução à importação de dados em Python

Arquivos pickle

  • Tipo de arquivo nativo do Python
  • Motivação: muitos tipos de dados sem forma óbvia de armazenar
  • Arquivos pickle são serializados
  • Serializar = converter objeto em fluxo de bytes
Introdução à importação de dados em Python

Arquivos pickle

import pickle
with open('pickled_fruit.pkl', 'rb') as file:
    data = pickle.load(file)    
print(data)
{'peaches': 13, 'apples': 4, 'oranges': 11}
Introdução à importação de dados em Python

Importando planilhas do Excel

import pandas as pd
file = 'urbanpop.xlsx'
data = pd.ExcelFile(file)
print(data.sheet_names)
['1960-1966', '1967-1974', '1975-2011']
df1 = data.parse('1960-1966') # sheet name, as a string
df2 = data.parse(0) # sheet index, as a float
Introdução à importação de dados em Python

Você vai aprender:

  • Como personalizar a importação
  • Pular linhas
  • Importar colunas específicas
  • Alterar nomes de colunas
Introdução à importação de dados em Python

Vamos praticar!

Introdução à importação de dados em Python

Preparing Video For Download...