"Ispezionare l'HTML"

Web Scraping in Python

Thomas Laetsch, PhD

Data Scientist, NYU

"Sorgente" = codice HTML

Visualizza sorgente

Sorgente

Web Scraping in Python

Ispezionare gli elementi

Ispeziona elemento

Sorgente elemento

Web Scraping in Python

Da testo HTML a Selector

from scrapy import Selector
import requests

url = 'https://en.wikipedia.org/wiki/Web_scraping'
html = requests.get( url ).content
sel = Selector( text = html )
Web Scraping in Python

Ora conosci i nostri segreti

Web Scraping in Python

Preparing Video For Download...