Importare file flat dal web

Importazione di dati in Python - livello intermedio

Hugo Bowne-Anderson

Data Scientist at DataCamp

Sai già importare alla grande!

  • File flat come .txt e .csv

  • File pickle, fogli Excel e altri!

  • Dati da database relazionali

  • Puoi fare tutto in locale

  • E se i dati sono online?

Importazione di dati in Python - livello intermedio

Sai importare dati dal web?

ch_1_1.010.png

  • Puoi: aprire l’URL e cliccare per scaricare file
  • MA: non è riproducibile né scalabile
Importazione di dati in Python - livello intermedio

Imparerai a…

  • Importare e salvare in locale dataset dal web

  • Caricare dataset in DataFrame pandas

  • Fare richieste HTTP (GET)

  • Fare scraping di dati web come HTML

  • Convertire HTML in dati utili (BeautifulSoup)

  • Usare i pacchetti urllib e requests

Importazione di dati in Python - livello intermedio

Il pacchetto urllib

  • Fornisce un’interfaccia per recuperare dati dal web
  • urlopen() - accetta URL invece di nomi file
Importazione di dati in Python - livello intermedio

Come automatizzare il download di file in Python

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Importazione di dati in Python - livello intermedio

Passiamo alla pratica!

Importazione di dati in Python - livello intermedio

Preparing Video For Download...