Cours accéléré X

Web Scraping en Python

Thomas Laetsch

Data Scientist, NYU

Encore une vidéo sanglante ?

xpath = '/html/body/div[2]'

XPath simple :

  • Une barre oblique / avance d’un niveau.
  • Les noms de balises entre les barres indiquent quels éléments cibler.
  • Les crochets [] après une balise choisissent un frère spécifique.
Web Scraping en Python

Encore une vidéo sanglante ?

div en surbrillance

xpath = '/html/body/div[2]'
Web Scraping en Python

Double séance sanglante ?

  • Cibler tous les éléments table dans tout le HTML :
xpath = '//table'
  • Cibler tous les éléments table descendants du 2ᵉ enfant div de l’élément body :
xpath = '/html/body/div[2]//table`
Web Scraping en Python

Ex(path)cellent

Web Scraping en Python

Preparing Video For Download...