Web Scraping in Python
Thomas Laetsch
Data Scientist, NYU
Selector vs Response:
xpath e css, seguiti da extract e extract_first.xpath funziona come un Selectorresponse.xpath( '//div/span[@class="bio"]' )
css funziona come un Selectorresponse.css( 'div > span.bio' )
response.xpath('//div').css('span.bio')
response.xpath('//div').css('span.bio').extract()
response.xpath('//div').css('span.bio').extract_first()
response tiene traccia dell'URL in response.url.response.url
>>> 'http://www.DataCamp.com/courses/all'
response ci permette di "seguire" un nuovo link con il metodo follow()# next_url è la stringa con il percorso del prossimo URL da scansionare
response.follow( next_url )
follow più avanti.Web Scraping in Python