Webscraping in Python
Thomas Laetsch
Data Scientist, NYU
Selector vs Response:
xpath- en css-methoden, gevolgd door extract en extract_first.xpath werkt zoals een Selectorresponse.xpath( '//div/span[@class="bio"]' )
css werkt zoals een Selectorresponse.css( 'div > span.bio' )
response.xpath('//div').css('span.bio')
response.xpath('//div').css('span.bio').extract()
response.xpath('//div').css('span.bio').extract_first()
response bewaart de URL in de variabele response.url.response.url
>>> 'http://www.DataCamp.com/courses/all'
response laat je een nieuwe link "volgen" met de methode follow()# next_url is het stringpad van de volgende url die we willen scrapen
response.follow( next_url )
follow.Webscraping in Python