Importando arquivos planos da web

Importação Intermediária de Dados em Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Você já é ótimo em importar!

  • Arquivos planos como .txt e .csv

  • Arquivos Pickle, planilhas Excel e muitos outros!

  • Dados de bancos de dados relacionais

  • Você pode fazer tudo isso localmente

  • E se seus dados estiverem online?

Importação Intermediária de Dados em Python

Você consegue importar dados da web?

ch_1_1.010.png

  • Você pode: ir ao URL e clicar para baixar arquivos
  • MAS: não é reproduzível, não é escalável
Importação Intermediária de Dados em Python

Você vai aprender a…

  • Importar e salvar datasets da web localmente

  • Carregar datasets em DataFrames do pandas

  • Fazer requisições HTTP (GET)

  • Raspar dados da web como HTML

  • Analisar HTML em dados úteis (BeautifulSoup)

  • Usar os pacotes urllib e requests

Importação Intermediária de Dados em Python

O pacote urllib

  • Fornece interface para buscar dados na web
  • urlopen() - aceita URLs em vez de nomes de arquivos
Importação Intermediária de Dados em Python

Como automatizar download de arquivos em Python

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Importação Intermediária de Dados em Python

Vamos praticar!

Importação Intermediária de Dados em Python

Preparing Video For Download...