Demandes HTTP pour l'importation de fichiers depuis le Web

Importation intermédiaire de données en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

URL

  • Localisateur de ressources uniforme/universel
  • Références aux ressources Web
  • Thème : adresses web
  • Ingrédients :
    • Identifiant du protocole : http:
    • Nom de la ressource : DataCamp.com
  • Ces éléments spécifient de manière unique les adresses Web
Importation intermédiaire de données en Python

HTTP

  • Protocole de transfert hypertexte
  • Fondements de la communication de données pour le Web
  • HTTPS : une version plus sécurisée du protocole HTTP
  • Accéder à un site web = envoyer une requête HTTP
    • Requête GET
  • urlretrieve() effectue une requête GET
  • HTML : Langage de balisage hypertexte
Importation intermédiaire de données en Python

Requêtes GET à l'aide de urllib

from urllib.request import urlopen, Request
url = "https://www.wikipedia.org/"
request = Request(url)
response = urlopen(request)
html = response.read()
response.close()
Importation intermédiaire de données en Python

Requêtes GET utilisant des requêtes

ch_1_2.026.png

  • Utilisées par « le gouvernement de Sa Majesté, Amazon, Google, Twilio, NPR, Obama for America, Twitter, Sony et le gouvernement fédéral américain. Des institutions qui préfèrent rester anonymes »
Importation intermédiaire de données en Python

Requêtes GET utilisant des requêtes

  • L'un des packages Python les plus téléchargés
import requests
url = "https://www.wikipedia.org/"
r = requests.get(url)
text = r.text
Importation intermédiaire de données en Python

Passons à la pratique !

Importation intermédiaire de données en Python

Preparing Video For Download...