HTML-tags en -attributen

Webscraping in Python

Thomas Laetsch

Data Scientist, NYU

Moet dat echt?

  • Info in HTML-tags kan waardevol zijn
  • Link-URL's extraheren
  • Makkelijker elementen selecteren
Webscraping in Python

Tag, jij bent 'm!

abstract_tag.png

  • We zagen tagnamen zoals html, div en p.
  • De attribuutnaam wordt gevolgd door = en de waarde voor dat attribuut, meestal tussen aanhalingstekens.
Webscraping in Python

Laten we de "div" verdelen

div_tag.png

  • id-attribuut moet uniek zijn
  • class-attribuut hoeft niet uniek te zijn
Webscraping in Python

"a" linkt

a_tag.png

  • a-tags zijn voor hyperlinks
  • href-attribuut geeft aan naar welke link
Webscraping in Python

Tagtractie

html_tags.png

Webscraping in Python

Et tu, attributen?

Webscraping in Python

Preparing Video For Download...