Flache Dateien aus dem Web importieren

Importing Data in Python (Fortgeschritten)

Hugo Bowne-Anderson

Data Scientist at DataCamp

Du kannst bereits echt gut importieren!

  • Flatfiles wie .txt und .csv

  • Pickled-Dateien, Excel-Tabellen und vieles mehr!

  • Daten aus relationalen Datenbanken

  • Du kannst all das bereits lokal tun.

  • Was ist, wenn deine Daten online sind?

Importing Data in Python (Fortgeschritten)

Kannst du Webdaten importieren?

ch_1_1.010.png

  • URL aufrufen, klicken, Dateien herunterladen
  • ABER: nicht reproduzierbar, nicht skalierbar
Importing Data in Python (Fortgeschritten)

Du lernst, wie man…

  • Datensätze aus dem Internet importiert und lokal speichert

  • Datensätze in pandas DataFrames lädt

  • HTTP-Requests ausführt (GET-Requests)

  • Webdaten wie HTML scrapen kann

  • HTML in nützliche Daten zerlegt (BeautifulSoup)

  • die Pakete urllib und requests benutzt

Importing Data in Python (Fortgeschritten)

Das urllib-Paket

  • Bietet eine Schnittstelle zum Abrufen von Daten aus dem Internet.
  • urlopen() – nimmt URLs statt Dateinamen entgegen
Importing Data in Python (Fortgeschritten)

Wie man den Download von Dateien in Python automatisiert

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Importing Data in Python (Fortgeschritten)

Lass uns üben!

Importing Data in Python (Fortgeschritten)

Preparing Video For Download...