Web scraping en Python
Thomas Laetsch
Data Scientist, NYU
Selector vs Response:
xpath y css, seguidos de extract y extract_first.xpath funciona como un Selectorresponse.xpath( '//div/span[@class="bio"]' )
css funciona como un Selectorresponse.css( 'div > span.bio' )
response.xpath('//div').css('span.bio')
response.xpath('//div').css('span.bio').extract()
response.xpath('//div').css('span.bio').extract_first()
response guarda la URL en la variable response.url.response.url
>>> 'http://www.DataCamp.com/courses/all'
response nos deja "seguir" un enlace con el método follow()# next_url es la ruta (string) de la próxima URL que queremos scrapear
response.follow( next_url )
follow después.Web scraping en Python