HTML-Tags und Attribute

Web Scraping in Python

Thomas Laetsch

Data Scientist, NYU

Müssen wir?

  • Infos in HTML-Tags können wertvoll sein
  • Link-URLs extrahieren
  • Elemente leichter auswählen
Web Scraping in Python

Tag, du bist dran!

abstract_tag.png

  • Wir haben Tag-Namen wie html, div und p gesehen.
  • Auf den Attributnamen folgt = und dann der Attributwert, meist in Anführungszeichen.
Web Scraping in Python

Lass uns das "div" aufteilen

div_tag.png

  • id-Attribut muss eindeutig sein
  • class-Attribut muss nicht eindeutig sein
Web Scraping in Python

"a" verlinkt

a_tag.png

  • a-Tags sind Hyperlinks
  • Das href-Attribut gibt das Ziel des Links an
Web Scraping in Python

Tag-Traktion

html_tags.png

Web Scraping in Python

Auch du, Attribute?

Web Scraping in Python

Preparing Video For Download...