Web Scraping in Python
Thomas Laetsch
Data Scientist, NYU
Selector vs. Response:
xpath- und css-Methoden, gefolgt von extract und extract_first.xpath funktioniert wie ein Selectorresponse.xpath( '//div/span[@class="bio"]' )
css funktioniert wie ein Selectorresponse.css( 'div > span.bio' )
response.xpath('//div').css('span.bio')
response.xpath('//div').css('span.bio').extract()
response.xpath('//div').css('span.bio').extract_first()
response speichert die URL in response.url.response.url
>>> 'http://www.DataCamp.com/courses/all'
response können wir mit follow() einem Link „folgen“# next_url ist der String-Pfad der nächsten zu scrapenden URL
response.follow( next_url )
follow später.Web Scraping in Python