Balises et attributs HTML
Web Scraping en Python
Thomas Laetsch
Data Scientist, NYU
Est-ce nécessaire ?
- Les informations dans les balises HTML peuvent être utiles
- Extraire les URL des liens
- Méthode plus simple pour sélectionner des éléments
À vous la balise !

- Nous avons vu des noms de balise comme html, div et p.
- Le nom d’attribut est suivi de = puis de sa valeur, généralement entre guillemets.
Découpons la balise « div »

- L’attribut id doit être unique
- L’attribut class n’a pas besoin d’être unique
« a » pour les liens

- Les balises a servent aux hyperliens
- L’attribut href indique la cible du lien
Et toi, l’attribut ?
Web Scraping en Python
Preparing Video For Download...