Solicitudes HTTP para importar archivos de la web

Importación intermedia de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

URL

  • Localizador de Recursos Uniforme/Universal
  • Referencias a recursos web
  • Enfoque: direcciones web
  • Componentes:
    • Identificador de protocolo - http:
    • Nombre del recurso - datacamp.com
  • Especifican direcciones web únicas
Importación intermedia de datos en Python

HTTP

  • Protocolo de Transferencia de Hipertexto
  • Base de la comunicación de datos en la web
  • HTTPS - forma más segura de HTTP
  • Visitar un sitio web = enviar solicitud HTTP
    • Solicitud GET
  • urlretrieve() realiza una solicitud GET
  • HTML - Lenguaje de Marcado de Hipertexto
Importación intermedia de datos en Python

Solicitudes GET usando urllib

from urllib.request import urlopen, Request
url = "https://www.wikipedia.org/"
request = Request(url)
response = urlopen(request)
html = response.read()
response.close()
Importación intermedia de datos en Python

Solicitudes GET usando requests

ch_1_2.026.png

  • Usado por “el Gobierno de Su Majestad, Amazon, Google, Twilio, NPR, Obama for America, Twitter, Sony e instituciones federales de EE.UU. que prefieren no ser nombradas”
Importación intermedia de datos en Python

Solicitudes GET usando requests

  • Uno de los paquetes de Python más descargados
import requests
url = "https://www.wikipedia.org/"
r = requests.get(url)
text = r.text
Importación intermedia de datos en Python

¡Vamos a practicar!

Importación intermedia de datos en Python

Preparing Video For Download...