Qu’est-ce que Snowflake ?

Introduction à Snowflake

Danny Hong

Senior Data Engineer

Votre instructeur

  • Je suis Danny Hong
    • Data Analytics Engineer, plus de 10 ans d'expérience
    • Expérience chez Google, Amazon et Meta
    • Expert Snowflake pour modèles de données et analyse big data

Image de Danny Hong

Introduction à Snowflake

Qu’est-ce que Snowflake ? (suite)

  • Snowflake = plateforme cloud de données IA et d’entrepôt de données

  • Couramment utilisée par ingénieurs/analystes Data/BI

  • Entrepôt de données

    • Permet de stocker de grandes quantités de données
    • Conçu pour l’analyse historique et le reporting avec du SQL

Un graphique d’un flux de travail analytique. Source de données chargée dans des tables SQL dans un entrepôt de données, interrogeable pour l’analyse ou des insights de reporting/tableau de bord.

Introduction à Snowflake

Pourquoi Snowflake est-il populaire ?

Plateforme de données en libre-service

  • Aucun matériel ou logiciel requis
  • Prêt à l'emploi après l’ajout d’un compte

Une image montrant une voiture nouvellement construite par rapport à une image d’une voiture en cours d’assemblage à partir de ses pièces.

Introduction à Snowflake

Quelques fonctionnalités Snowflake à retenir

  • Compatible avec les principaux fournisseurs cloud
    • Exemple : pipeline de données pour le streaming vidéo
    • Logos des fournisseurs de cloud AWS, GCP et Azure
  • Peut unifier des sources de données externes
  • Contrôles de gouvernance des données
    • Applique le principe du moindre privilège
Introduction à Snowflake

Interface Snowsight

Capture d’écran de l’interface Snowsight

Introduction à Snowflake

Marketplace de données dans Snowsight

Introduction à Snowflake

L’architecture des données Snowflake

Image de l’architecture de Snowflake incluant les couches Cloud Services, Query Processing et Database Storage.

  • Services cloud
    • Coordonner les activités utilisateurs
  • Traiter les requêtes
    • Utilise l’architecture de traitement massivement parallèle (MPP)
    • Répartit données et ressources de calcul sur cluster de nœuds (ordinateurs)
  • Stockage de base de données
    • Stocke les données en colonnes (optimisé pour requêtes analytiques)
1 https://docs.snowflake.com/en/user-guide/intro-key-concepts#snowflake-architecture
Introduction à Snowflake

Passons à la pratique !

Introduction à Snowflake

Preparing Video For Download...