Inspeccionar el HTML

Web scraping en Python

Thomas Laetsch, PhD

Data Scientist, NYU

"Source" = código HTML

Ver código fuente

Código fuente

Web scraping en Python

Inspeccionar elementos

Inspeccionar elemento

Código del elemento

Web scraping en Python

De texto HTML a Selector

from scrapy import Selector
import requests

url = 'https://en.wikipedia.org/wiki/Web_scraping'
html = requests.get( url ).content
sel = Selector( text = html )
Web scraping en Python

Ya conoces nuestros secretos

Web scraping en Python

Preparing Video For Download...