Arrêtez de gratter, commencez à scraper !

Web Scraping en Python

Thomas Laetsch

Data Scientist, NYU

Alimenter la machine

Web Scraping en Python

Compétences de scraping

  • Objectif : extraire un site web par programme
  • Comment ? Nous choisissons scrapy
  • Comment ? Nous devons utiliser :
    • Objets Selector et Response
    • Peut-être créer un Spider
  • Comment ? Apprendre XPath ou les sélecteurs CSS
  • Comment ? Comprendre la structure HTML
Web Scraping en Python

Que savez-vous ?

  • Structure du HTML
  • XPath et sélecteurs CSS
  • Utilisation des objets Selector et Response dans scrapy
  • Configuration d’un spider
  • Scraper le web
Web Scraping en Python

FIN

Web Scraping en Python

Preparing Video For Download...