Web scraping con Python

Web scraping en Python

Thomas Laetsch

Data Scientist, NYU

Visión de negocio

¿Qué buscan las empresas?

  • Comparar precios
  • Satisfacción de clientes
  • Generar clientes potenciales
  • ...¡y mucho más!
Web scraping en Python

Es personal

¿Qué podrías hacer?

  • Buscar tus memes favoritos en tus sitios favoritos.
  • Revisar automáticamente clasificados para tus gadgets favoritos.
  • Hacer scraping en redes para temas en tendencia.
  • Hacer scraping en blogs de cocina para recetas o reseñas.
  • ...¡y mucho más!
Web scraping en Python

Sobre mi trabajo

AVorg.png

Web scraping en Python

Sueño de pipeline

Configuración del pipeline: adquisición y procesamiento

Web scraping en Python

Sueño de pipeline: Preparación

Configuración del pipeline

Preparación

  • Definir qué queremos hacer.
  • Buscar fuentes que ayuden a hacerlo.
Web scraping en Python

Sueño de pipeline: Adquisición

Configuración del pipeline: adquisición

Adquisición

  • Leer datos brutos online.
  • Darles formato utilizable.
Web scraping en Python

Sueño de pipeline: Procesamiento

Configuración del pipeline: adquisición y procesamiento

Procesamiento

  • ¡Muchas opciones!
Web scraping en Python

¿Cómo se hace?

Nuestro foco

  • ¡Adquisición!
  • (Usando scrapy con python)
Web scraping en Python

¿Te apuntas?

Web scraping en Python

Preparing Video For Download...