XPath-Navigation

Web Scraping in Python

Thomas Laetsch

Data Scientist, NYU

Slashes und Klammern

  • Ein Schrägstrich / schaut eine Ebene vor
  • Doppel-Schrägstrich // schaut alle folgenden Ebenen vor
  • Eckklammern [] grenzen auf bestimmte Elemente ein
Web Scraping in Python

Klammern oder nicht?

Auswahl für body

xpath = '/html/body'
xpath = '/html[1]/body[1]'
  • Ergibt dieselbe Auswahl
Web Scraping in Python

Ein Body voller p

xpath = '/html/body/p'

Auswahl für p in body

Web Scraping in Python

Die Vögel und die p

xpath = '/html/body/div/p'

Auswahl für div > p

xpath = '/html/body/div/p[2]'

Auswahl für div > zweites p

Web Scraping in Python

Doppelschrägstrich mit Klammern

xpath = '//p'

Auswahl für p in XPath

xpath = '//p[1]'

Auswahl für body: erstes p

Web Scraping in Python

Der Wildcard

xpath = '/html/body/*'

Auswahl für body: alle Kinder

  • Sternchen * ist der „Wildcard“
Web Scraping in Python

Xposé

Web Scraping in Python

Preparing Video For Download...