Navegación con XPath

Web scraping en Python

Thomas Laetsch

Data Scientist, NYU

Barras y corchetes

  • Una barra / avanza una generación
  • Doble barra // recorre todas las generaciones futuras
  • Los corchetes [] afinan la selección de elementos
Web scraping en Python

¿Con corchetes o sin ellos?

xpath_body_sel.png

xpath = '/html/body'
xpath = '/html[1]/body[1]'
  • Dan la misma selección
Web scraping en Python

Un body de P

xpath = '/html/body/p'

xpath_p_sel.png

Web scraping en Python

Entre pájaros y p

xpath = '/html/body/div/p'

xpath_div_p_sel.png

xpath = '/html/body/div/p[2]'

xpath_div_p2_sel.png

Web scraping en Python

Dobles barras y corchetes

xpath = '//p'

xpath_p_sel.png

xpath = '//p[1]'

xpath_body_ssp1_sel.png

Web scraping en Python

El comodín

xpath = '/html/body/*'

xpath_body_ast_sel.png

  • El asterisco * es el comodín
Web scraping en Python

Xposé

Web scraping en Python

Preparing Video For Download...