Web'den dosya almak için HTTP istekleri

Python'da Orta Düzey Veri İçe Aktarma

Hugo Bowne-Anderson

Data Scientist at DataCamp

URL

  • Uniform/Universal Resource Locator
  • Web kaynaklarına başvurular
  • Odak: web adresleri
  • Bileşenler:
    • Protokol tanımlayıcı — http:
    • Kaynak adı — datacamp.com
  • Bunlar web adreslerini benzersiz kılar
Python'da Orta Düzey Veri İçe Aktarma

HTTP

  • HyperText Transfer Protocol
  • Web için veri iletişiminin temeli
  • HTTPS — HTTP'nin daha güvenli biçimi
  • Bir siteye gitmek = HTTP isteği göndermek
    • GET isteği
  • urlretrieve() bir GET isteği yapar
  • HTML — HyperText Markup Language
Python'da Orta Düzey Veri İçe Aktarma

urllib ile GET istekleri

from urllib.request import urlopen, Request
url = "https://www.wikipedia.org/"
request = Request(url)
response = urlopen(request)
html = response.read()
response.close()
Python'da Orta Düzey Veri İçe Aktarma

requests ile GET istekleri

ch_1_2.026.png

  • “Majestelerinin Hükümeti, Amazon, Google, Twilio, NPR, Obama for America, Twitter, Sony ve adı verilmeyi tercih etmeyen ABD federal kurumları” tarafından kullanılır
Python'da Orta Düzey Veri İçe Aktarma

requests ile GET istekleri

  • En çok indirilen Python paketlerinden biri
import requests
url = "https://www.wikipedia.org/"
r = requests.get(url)
text = r.text
Python'da Orta Düzey Veri İçe Aktarma

Haydi pratik yapalım!

Python'da Orta Düzey Veri İçe Aktarma

Preparing Video For Download...