Balises et attributs HTML

Web Scraping en Python

Thomas Laetsch

Data Scientist, NYU

Est-ce nécessaire ?

  • Les informations dans les balises HTML peuvent être utiles
  • Extraire les URL des liens
  • Méthode plus simple pour sélectionner des éléments
Web Scraping en Python

À vous la balise !

balise abstraite

  • Nous avons vu des noms de balise comme html, div et p.
  • Le nom d’attribut est suivi de = puis de sa valeur, généralement entre guillemets.
Web Scraping en Python

Découpons la balise « div »

balise div

  • L’attribut id doit être unique
  • L’attribut class n’a pas besoin d’être unique
Web Scraping en Python

« a » pour les liens

balise a

  • Les balises a servent aux hyperliens
  • L’attribut href indique la cible du lien
Web Scraping en Python

Accroche des balises

balises html

Web Scraping en Python

Et toi, l’attribut ?

Web Scraping en Python

Preparing Video For Download...