Inspecionando o HTML

Raspagem da Web em Python

Thomas Laetsch, PhD

Data Scientist, NYU

“Source” = código HTML

Exibir código-fonte

Código-fonte

Raspagem da Web em Python

Inspecionando elementos

Inspecionar elemento

Fonte do elemento

Raspagem da Web em Python

Texto HTML para Selector

from scrapy import Selector
import requests

url = 'https://en.wikipedia.org/wiki/Web_scraping'
html = requests.get( url ).content
sel = Selector( text = html )
Raspagem da Web em Python

Agora você sabe nossos segredos

Raspagem da Web em Python

Preparing Video For Download...