Web Scraping dengan Python
Thomas Laetsch
Data Scientist, NYU
Selector vs Response:
Response memiliki semua alat yang kita pelajari dengan Selector:xpath dan css diikuti metode extract dan extract_first.Response juga menyimpan jejak URL sumber HTML dimuat.Response membantu kita berpindah antar situs, sehingga kita bisa "merayapi" web saat scraping.xpath bekerja seperti Selectorresponse.xpath( '//div/span[@class="bio"]' )
css bekerja seperti Selectorresponse.css( 'div > span.bio' )
response.xpath('//div').css('span.bio')
response.xpath('//div').css('span.bio').extract()
response.xpath('//div').css('span.bio').extract_first()
response menyimpan URL pada variabel response.url.response.url
>>> 'http://www.DataCamp.com/courses/all'
response memungkinkan kita "mengikuti" tautan baru dengan metode follow()# next_url adalah path string dari url berikutnya yang ingin kita scrap
response.follow( next_url )
follow nanti.Web Scraping dengan Python