HTTP-Requests zum Import von Dateien aus dem Internet

Importing Data in Python (Fortgeschritten)

Hugo Bowne-Anderson

Data Scientist at DataCamp

URL

  • Uniform/Universal Resource Locator
  • Referenzen auf Webressourcen
  • Fokus: Webadressen
  • Zutaten:
    • Protokollkennung – http:
    • Name der Quelle – DataCamp.com
  • Definieren eine Webadressen eindeutig
Importing Data in Python (Fortgeschritten)

HTTP

  • HyperText Transfer Protocol
  • Grundlagen der Datenkommunikation für das Web
  • HTTPS – die sicherere Version von HTTP
  • Eine Website aufrufen = HTTP-Anfrage senden
    • GET Requests
  • urlretrieve() erstellt einen GET-Request
  • HTML - HyperText Markup Language
Importing Data in Python (Fortgeschritten)

GET Requests mit urllib

from urllib.request import urlopen, Request
url = "https://www.wikipedia.org/"
request = Request(url)
response = urlopen(request)
html = response.read()
response.close()
Importing Data in Python (Fortgeschritten)

Requests für GET Requests nutzen

ch_1_2.026.png

  • Verwendet von „Amazon, Google, Twilio, NPR, Obama for America, Twitter, Sony und der US-Bundesregierung. Sowie weitere Institutionen, die lieber anonym bleiben wollen“
Importing Data in Python (Fortgeschritten)

Requests für GET Requests nutzen

  • Eines der am häufigsten heruntergeladenen Python-Pakete
import requests
url = "https://www.wikipedia.org/"
r = requests.get(url)
text = r.text
Importing Data in Python (Fortgeschritten)

Lass uns üben!

Importing Data in Python (Fortgeschritten)

Preparing Video For Download...