Pare de coçar e comece a fazer scraping!

Raspagem da Web em Python

Thomas Laetsch

Data Scientist, NYU

Alimentando a máquina

Raspagem da Web em Python

Habilidades de scraping

  • Objetivo: Fazer scraping de um site de forma computacional
  • Como? Vamos usar scrapy
  • Como? Precisamos trabalhar com:
    • Objetos Selector e Response
    • Talvez até criar uma Spider
  • Como? Aprender XPath ou seletores CSS
  • Como? Entender a estrutura do HTML
Raspagem da Web em Python

O que você já sabe?

  • Estrutura do HTML
  • XPath e seletores CSS
  • Como usar objetos Selector e Response no scrapy
  • Como configurar uma spider
  • Como fazer scraping na web
Raspagem da Web em Python

FIM

Raspagem da Web em Python

Preparing Video For Download...