Riepilogo: Web scraping in R

Web scraping in R

Timo Grossenbacher

Instructor

Concetti trattati

  • Capitolo 1: Introduzione a HTML e web scraping
  • Capitolo 2: Navigazione e selezione con CSS
    • Tecnologie web di base e come sfruttarle per lo scraping
    • Il pacchetto rvest
  • Capitolo 3: Selezione avanzata con XPATH
    • Funzioni XPATH come position() o text()
    • Selezione dei nodi in base ai nodi circostanti (es. figli)
  • Capitolo 4: Best practice di scraping
    • Alla base di tutto: HTTP (e il pacchetto httr)
    • Best practice come throttling e identificazione degli user agent
Web scraping in R

Cosa fare con i dati estratti?

Web scraping in R

Buono scraping!

Web scraping in R

Preparing Video For Download...