Curso exprés X

Web scraping en Python

Thomas Laetsch

Data Scientist, NYU

¿Otro slasher más?

xpath = '/html/body/div[2]'

XPath simple:

  • Una barra / avanza una generación.
  • Los nombres de etiquetas entre barras indican a qué elemento(s) ir.
  • Corchetes [] tras una etiqueta eligen cuál de los hermanos seleccionados.
Web scraping en Python

¿Otro slasher más?

Div resaltado

xpath = '/html/body/div[2]'
Web scraping en Python

¿Doble sesión slasher?

  • Apunta a todos los elementos table en todo el HTML:
xpath = '//table'
  • Apunta a todos los table que son descendientes del 2.º hijo div de body:
xpath = '/html/body/div[2]//table`
Web scraping en Python

Ex(path)celente

Web scraping en Python

Preparing Video For Download...