HTTP-verzoeken om bestanden van het web te importeren

Gevorderd data importeren in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

URL

  • Uniform/Universal Resource Locator
  • Verwijzingen naar webbronnen
  • Focus: webadressen
  • Onderdelen:
    • Protocolidentifier - http:
    • Resourcenaam - datacamp.com
  • Bepalen webadressen uniek
Gevorderd data importeren in Python

HTTP

  • HyperText Transfer Protocol
  • Basis van datacommunicatie op het web
  • HTTPS - veiligere variant van HTTP
  • Naar een website gaan = HTTP-verzoek sturen
    • GET-verzoek
  • urlretrieve() voert een GET uit
  • HTML - HyperText Markup Language
Gevorderd data importeren in Python

GET-verzoeken met urllib

from urllib.request import urlopen, Request
url = "https://www.wikipedia.org/"
request = Request(url)
response = urlopen(request)
html = response.read()
response.close()
Gevorderd data importeren in Python

GET-verzoeken met requests

ch_1_2.026.png

  • Gebruikt door “Her Majesty's Government, Amazon, Google, Twilio, NPR, Obama for America, Twitter, Sony en Amerikaanse overheidsinstanties die niet genoemd willen worden”
Gevorderd data importeren in Python

GET-verzoeken met requests

  • Een van de meest gedownloade Python-pakketten
import requests
url = "https://www.wikipedia.org/"
r = requests.get(url)
text = r.text
Gevorderd data importeren in Python

Laten we oefenen!

Gevorderd data importeren in Python

Preparing Video For Download...