Menelusuri HTML

Web Scraping dengan Python

Thomas Laetsch, PhD

Data Scientist, NYU

"Source" = Kode HTML

Lihat Sumber.png

Sumber.png

Web Scraping dengan Python

Memeriksa Elemen

Inspect Element.png

Sumber Elemen.png

Web Scraping dengan Python

Teks HTML ke Selector

from scrapy import Selector
import requests

url = 'https://en.wikipedia.org/wiki/Web_scraping'
html = requests.get( url ).content
sel = Selector( text = html )
Web Scraping dengan Python

Kini Anda Tahu Rahasia Kami

Web Scraping dengan Python

Preparing Video For Download...