Mengimpor flat file dari web

Mengimpor Data Tingkat Menengah di Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Anda sudah mahir mengimpor!

  • Flat file seperti .txt dan .csv

  • File pickle, spreadsheet Excel, dan lainnya

  • Data dari basis data relasional

  • Semua ini dapat dilakukan secara lokal

  • Bagaimana jika data Anda ada online?

Mengimpor Data Tingkat Menengah di Python

Dapatkah Anda mengimpor data web?

ch_1_1.010.png

  • Bisa: buka URL dan klik untuk mengunduh file
  • Tapi: tidak dapat direproduksi, tidak skalabel
Mengimpor Data Tingkat Menengah di Python

Anda akan belajar untuk…

  • Impor dan simpan dataset dari web secara lokal

  • Muat dataset ke pandas DataFrame

  • Lakukan permintaan HTTP (GET)

  • Scrap data web seperti HTML

  • Ubah HTML menjadi data berguna (BeautifulSoup)

  • Gunakan paket urllib dan requests

Mengimpor Data Tingkat Menengah di Python

Paket urllib

  • Antarmuka untuk mengambil data dari web
  • urlopen() - menerima URL alih-alih nama file
Mengimpor Data Tingkat Menengah di Python

Cara mengotomatisasi pengunduhan file di Python

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Mengimpor Data Tingkat Menengah di Python

Ayo berlatih!

Mengimpor Data Tingkat Menengah di Python

Preparing Video For Download...