Informations de base sur les données

Présentation des données

Maarten Van den Broeck

Senior Content Developer at DataCamp

Les données sont partout

Quatre avatars de personnes

Présentation des données

Les données sont partout

Quatre avatars de personnes et trois cercles avec nom, âge, hobbies

Présentation des données

Les données sont partout

Quatre avatars de personnes avec trois bulles, un t-shirt, une tasse de café et des icônes de médias sociaux

Présentation des données

Les données sont partout

Quatre avatars de personnes avec trois bulles : un arbre, la terre, la lune et une mini-fusée

Présentation des données

Les données sont partout

Quatre avatars de personnes avec trois bulles : un arbre, la terre, la lune et une mini-fusée

Présentation des données

Les données sont partout

Quatre avatars de personnes avec trois bulles : un arbre, la terre, la lune et une mini-fusée

Présentation des données

Que sont les données ?

$$

  • Du latin, datum : donné, fait

Illustration du fichier de données

Présentation des données

Que sont les données ?

$$

  • Du latin, datum : donné, fait
  • Une ressource précieuse à l'ère du numérique$^1$

Illustration du fichier de données avec un cachet de fait

1 The Economist, 6 mai 2017 : La ressource la plus précieuse au monde n'est plus le pétrole, mais bien les données
Présentation des données

Contexte des données

$$

  • Qui est un grand joueur ?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals

Présentation des données

Contexte des données

$$

  • Qui est un grand joueur ?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals mise en valeur des buts de messi

Présentation des données

Contexte des données

$$

  • Qui est un grand joueur ?
    • Lionel Messi
    • Alexander Ovechkin

$$

Messi_vs_Ovechkin_Goals mise en valeur des buts d'ovechkin

Présentation des données

Contexte des données

$$

Informations qui donnent un sens aux données

  • Date de la collecte des données
  • Où les données ont été collectées

Ces caractéristiques des données sont appelées métadonnées

$$

Messi_vs_Ovechkin_Goals

Présentation des données

Types de données

Non structurées :

  • Vidéo d'un match de football
  • Sans étiquette ni ordre

$$

Structurées :

  • Table des buts, des temps, des joueurs
  • Organisées et plus facile à analyser

Données non structurées ou structurées

Données quantitatives ou qualitatives

Présentation des données

Titre des données structurées

  • Courant dans les feuilles de calcul
  • Facile à filtrer et à analyser

Exemples :

  • Registres des ventes
  • Présence des employés
  • Données météorologiques

$$

$$

Registres des ventes  

Identifiant Produit Ventes
1 T-shirt 15
2 Jeans 2
3 Chaussures 3
4 Veste 1
5 Chapeau 5
Présentation des données

Non structurées

  • Plus difficiles à analyser
  • Besoin de traitement

Exemples :

  • Vidéos
  • Interviews
  • Images

$$

Icône vidéo

Présentation des données

Quantitatives

  • Également appelées données numériques
  • Idéales pour les calculs et les visualisations

Exemples :

  • Points marqués
  • Taille
  • Température

Qualitatives

  • Également appelées données catégorielles
  • Utiles pour repérer des modèles

$$

Exemples :

  • Sports préférés
  • Commentaires des clients
Présentation des données

Récapitulons

$$

  • Structurées : organisées et faciles à analyser

  • Non structurées : complexes mais instructives

  • Quantitatives : numériques et idéales pour les calculs

  • Qualitatives : décrivent les catégories et révèlent les tendances

Données non structurées ou structurées

Données quantitatives ou qualitatives

Présentation des données

Passons à la pratique !

Présentation des données

Preparing Video For Download...