Scraping web avec Python

Web Scraping en Python

Thomas Laetsch

Data Scientist, NYU

Sens des affaires

Que recherchent les entreprises ?

  • Comparer les prix
  • Satisfaction client
  • Générer des prospects
  • …et bien plus encore !
Web Scraping en Python

C’est personnel

Que pourriez-vous faire ?

  • Chercher vos mèmes favoris sur vos sites préférés.
  • Parcourir automatiquement les petites annonces pour vos gadgets favoris.
  • Scraper des réseaux sociaux pour repérer les sujets tendances.
  • Scraper des blogs de cuisine pour des recettes ciblées ou leurs avis.
  • …et bien plus encore !
Web Scraping en Python

À propos de mon travail

AVorg.png

Web Scraping en Python

Rêve de pipeline

Configuration du pipeline : acquisition + traitement

Web Scraping en Python

Rêve de pipeline : configuration

Configuration du pipeline

Configuration

  • Définir l’objectif.
  • Trouver les sources pour y parvenir.
Web Scraping en Python

Rêve de pipeline : acquisition

Configuration du pipeline : acquisition

Acquisition

  • Charger les données brutes en ligne.
  • Les formater pour qu’elles soient utilisables.
Web Scraping en Python

Rêve de pipeline : traitement

Configuration du pipeline : acquisition + traitement

Traitement

  • De nombreuses options !
Web Scraping en Python

Comment procéder ?

Notre focus

  • Acquisition !
  • (Avec scrapy via python)
Web Scraping en Python

Partant ?

Web Scraping en Python

Preparing Video For Download...