Web’den düz dosya içe aktarma

Python'da Orta Düzey Veri İçe Aktarma

Hugo Bowne-Anderson

Data Scientist at DataCamp

Zaten içe aktarmada iyisiniz!

  • .txt ve .csv gibi düz dosyalar

  • Pickle dosyaları, Excel tabloları ve daha fazlası!

  • İlişkisel veritabanlarından veriler

  • Bunların tümünü yerelde yapabilirsiniz

  • Peki veriniz çevrimiçiyse?

Python'da Orta Düzey Veri İçe Aktarma

Web verisini içe aktarabilir misiniz?

ch_1_1.010.png

  • Yapabilecekleriniz: URL’ye gidip tıklayarak dosya indirmek
  • Ancak: tekrarlanabilir değil, ölçeklenebilir değil
Python'da Orta Düzey Veri İçe Aktarma

Öğrenecekleriniz

  • Web’den veri kümelerini içe aktarın ve yerel olarak kaydedin

  • Veri kümelerini pandas DataFrame’lerine yükleyin

  • HTTP istekleri yapın (GET)

  • HTML gibi web verilerini kazıyın

  • HTML’yi yararlı verilere ayrıştırın (BeautifulSoup)

  • urllib ve requests paketlerini kullanın

Python'da Orta Düzey Veri İçe Aktarma

urllib paketi

  • Web genelinde veri getirmek için arayüz sağlar
  • urlopen() - dosya adı yerine URL kabul eder
Python'da Orta Düzey Veri İçe Aktarma

Python’da dosya indirmeyi nasıl otomatikleştirirsiniz

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Python'da Orta Düzey Veri İçe Aktarma

Haydi pratik yapalım!

Python'da Orta Düzey Veri İçe Aktarma

Preparing Video For Download...