Stoomcursus X

Webscraping in Python

Thomas Laetsch

Data Scientist, NYU

Nog een slasher-video?

xpath = '/html/body/div[2]'

Eenvoudige XPath:

  • Één schuine streep / gaat één niveau omlaag.
  • Tagnamen tussen slashes geven aan naar welk(e) element(en).
  • Haken [] na een tagnaam kiezen een specifiek sibling.
Webscraping in Python

Nog een slasher-video?

gemarkeerde_div.png

xpath = '/html/body/div[2]'
Webscraping in Python

Slasher double feature?

  • Verwijs naar alle table-elementen in de hele HTML:
xpath = '//table'
  • Verwijs naar alle table-elementen die afstammen van het 2e div-kind van het body-element:
xpath = '/html/body/div[2]//table`
Webscraping in Python

Ex(path)cellent

Webscraping in Python

Preparing Video For Download...