Data-basics

Introductie tot data

Maarten Van den Broeck

Senior Content Developer at DataCamp

Data is overal

Vier avatars van mensen

Introductie tot data

Data is overal

Vier avatars en drie cirkels met naam, leeftijd, hobby's

Introductie tot data

Data is overal

Vier avatars met drie bubbels met een T-shirt, een koffiebeker en socialmedia-iconen

Introductie tot data

Data is overal

Vier avatars met drie bubbels: een boom, de aarde, de maan en een mini-raket

Introductie tot data

Data is overal

Vier avatars met drie bubbels: een boom, de aarde, de maan en een mini-raket

Introductie tot data

Data is overal

Vier avatars met drie bubbels: een boom, de aarde, de maan en een mini-raket

Introductie tot data

Wat is data?

$$

  • Afkomstig van datum: gegeven, feit

Illustratie van databestand

Introductie tot data

Wat is data?

$$

  • Afkomstig van datum: gegeven, feit
  • Waardevolle hulpbron in dit digitale tijdperk$^1$

Databestand met 'fact'-stempel

1 The Economist, 6 mei 2017: De meest waardevolle hulpbron ter wereld is niet langer olie, maar data
Introductie tot data

Datacontext

$$

  • Wie is een top­sporter?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals

Introductie tot data

Datacontext

$$

  • Wie is een top­sporter?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals met Messi-doelpunten gemarkeerd

Introductie tot data

Datacontext

$$

  • Wie is een top­sporter?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals met Ovechkin-doelpunten gemarkeerd

Introductie tot data

Datacontext

$$

Informatie die data betekenis geeft

  • Wanneer de data is verzameld
  • Waar de data is verzameld
  • ...

Deze kenmerken van de data heten de metadata

$$

Messi_vs_Ovechkin_Goals

Introductie tot data

Datatypen

Ongestructureerd:

  • Voetbalwedstrijd­video
  • Zonder labels of volgorde

$$

Gestructureerd:

  • Tabel met doelpunten, tijden, spelers
  • Georganiseerd en makkelijker te analyseren

Ongestructureerde of gestructureerde data

Kwantitatieve of kwalitatieve data

Introductie tot data

Titel gestructureerde data

  • Veelvoorkomend in spreadsheets
  • Makkelijk te filteren en analyseren

Voorbeelden:

  • Verkooprecords
  • Werknemers­aanwezigheid
  • Weerdata

$$

$$

Verkooprecords  

ID Product Verkoop
1 T-shirt 15
2 Jeans 2
3 Shoes 3
4 Jacket 1
5 Hat 5
Introductie tot data

Ongestructureerd

  • Moeilijker te analyseren
  • Vereist verwerking

Voorbeelden:

  • Video's
  • Interviews
  • Afbeeldingen

$$

Video-pictogram

Introductie tot data

Kwantitatief

  • Ook numerieke data genoemd
  • Ideaal voor berekeningen en visualisaties

Voorbeelden:

  • Gescoorde punten
  • Lengte
  • Temperatuur

Kwalitatief

  • Ook categorische data genoemd
  • Handig om patronen te zien

$$

Voorbeelden:

  • Favoriete sporten
  • Klantfeedback
Introductie tot data

Even herhalen

$$

  • Gestructureerd: georganiseerd en makkelijk te analyseren

  • Ongestructureerd: complex maar waardevol

  • Kwantitatief: numeriek en ideaal voor berekeningen

  • Kwalitatief: categorieën beschrijven en trends tonen

Ongestructureerde of gestructureerde data

Kwantitatieve of kwalitatieve data

Introductie tot data

Laten we oefenen!

Introductie tot data

Preparing Video For Download...