Curso relâmpago X

Raspagem da Web em Python

Thomas Laetsch

Data Scientist, NYU

Outro filme slasher?

xpath = '/html/body/div[2]'

XPath simples:

  • Uma barra / avança uma geração.
  • Nomes de tags entre barras indicam o(s) elemento(s) alvo.
  • Colchetes [] após a tag escolhem qual irmão selecionar.
Raspagem da Web em Python

Outro filme slasher?

Div destacado

xpath = '/html/body/div[2]'
Raspagem da Web em Python

Sessão dupla slasher?

  • Aponta para todas as table em todo o HTML:
xpath = '//table'
  • Aponta para todas as table descendentes do 2º div dentro de body:
xpath = '/html/body/div[2]//table`
Raspagem da Web em Python

Ex(path)celente

Raspagem da Web em Python

Preparing Video For Download...