Fuera del XPath típico

Web scraping en Python

Thomas Laetsch

Data Scientist, NYU

Atri(buto)

  • @ representa «atributo»
    • @class
    • @id
    • @href
Web scraping en Python

Corchetes y atributos

corchetes y atributos de xpath

Web scraping en Python

Corchetes y atributos

div con p[1] y class

xpath = '//p[@class="class-1"]'
Web scraping en Python

Corchetes y atributos

selección de div por id con xpath

xpath = '//*[@id="uid"]'
Web scraping en Python

Corchetes y atributos

atributos de xpath en un div

xpath = '//div[@id="uid"]/p[2]'
Web scraping en Python

Contenido con contains

Notación contains en XPath:

contains( @nombre-attr, "expr-cadena" )

Web scraping en Python

Usa contains

xpath = '//*[contains(@class,"class-1")]'

Selección por clase con xpath contains

Web scraping en Python

Igualdad exacta

xpath = '//*[@class="class-1"]'

Selección por clase con igualdad en xpath

Web scraping en Python

Clase en mano

atributos de xpath en un div

xpath = '/html/body/div/p[2]'
Web scraping en Python

Clase en mano

p[2] con atributo class

xpath = '/html/body/div/p[2]/@class'
Web scraping en Python

Fin del camino

Web scraping en Python

Preparing Video For Download...