Fora do XPath comum

Raspagem da Web em Python

Thomas Laetsch

Data Scientist, NYU

(A)tributo

  • @ representa "atributo"
    • @class
    • @id
    • @href
Raspagem da Web em Python

Colchetes e atributos

xpathattr.png

Raspagem da Web em Python

Colchetes e atributos

xpathattr_div_p1.png

xpath = '//p[@class="class-1"]'
Raspagem da Web em Python

Colchetes e atributos

xpathattr_div.png

xpath = '//*[@id="uid"]'
Raspagem da Web em Python

Colchetes e atributos

xpathattr_div_astc2.png

xpath = '//div[@id="uid"]/p[2]'
Raspagem da Web em Python

Conteúdo com contains

Notação contains do XPath:

contains( @nome-atrib, "expr-string" )

Raspagem da Web em Python

Use contains

xpath = '//*[contains(@class,"class-1")]'

ClassSelection-Xpath-contains.png

Raspagem da Web em Python

Use igualdade

xpath = '//*[@class="class-1"]'

ClassSelection-Xpath-eq.png

Raspagem da Web em Python

Seja classudo

xpathattr_div_astc2.png

xpath = '/html/body/div/p[2]'
Raspagem da Web em Python

Seja classudo

xpathattr_div_p2-class.png

xpath = '/html/body/div/p[2]/@class'
Raspagem da Web em Python

Fim do caminho

Raspagem da Web em Python

Preparing Video For Download...