Was ist Snowflake?

Einführung in Snowflake

Danny Hong

Senior Data Engineer

Dein Lehrer

  • Ich bin Danny Hong.
    • Über 10 Jahre Erfahrung als Datenanalyse-Ingenieur
    • Hat bei Google, Amazon und Meta gearbeitet
    • Experte für Snowflake bei Datenmodellen und Big-Data-Analysen

Bild von Danny Hong

Einführung in Snowflake

Was ist Snowflake? (Fortsetzung)

  • Snowflake ist eine der besten KI-Daten-Cloud- und Data-Warehousing-Plattformen.

  • Wird oft von Daten-/BI-Ingenieuren und Analysten benutzt

  • Data Warehouse

    • Ein Speicherplatz für die Ablage von vielen historischen Daten
    • Entwickelt, um historische Analysen und Berichte mit SQL zu unterstützen

![Ein Diagramm eines Analyse-Workflows. Die Quelldaten werden in SQL-Tabellen in einem Data Warehouse gespeichert, die für Analysen oder Berichte/Dashboard-Einblicke abgefragt werden können. (https://assets.datacamp.com/production/repositories/6857/datasets/3b943edfbb38d8b699a22d08b0f79f2b565607c9/data_warehouse.drawio.png =70)

Einführung in Snowflake

Warum ist Snowflake so beliebt?

Datenplattform als selbstverwalteter Service

  • Keine Hardware- oder Softwarebereitstellung nötig
  • Nach der Anmeldung für ein neues Konto kannst du loslegen.

Ein Bild, das ein neu gebautes Auto zeigt, im Vergleich zu einem Bild, auf dem ein Auto aus seinen Teilen zusammengebaut wird.

Einführung in Snowflake

Ein paar Highlights von Snowflake

  • Unterstützt die Verbindung mit den wichtigsten Cloud-Anbietern
    • Beispiel: Datenpipeline für eine Video-Streaming-App
    • Logos der Cloud-Anbieter AWS, GCP und Azure
  • Fähigkeit, externe Datenquellen zusammenzuführen
  • Kontrollen zur Datenverwaltung
    • Sorg dafür, dass nur die nötigsten Zugriffsrechte vergeben werden.
Einführung in Snowflake

Snowsight-Benutzeroberfläche

Screenshot der Snowsight-Benutzeroberfläche

Einführung in Snowflake

Datenmarktplatz in Snowsight

Einführung in Snowflake

Die Datenarchitektur von Snowflake

Bild der Architektur-Ebenen von Snowflake, einschließlich Cloud-Dienste, Abfrageverarbeitung und Datenbankspeicherung.

  • Cloud-Dienste
    • Benutzeraktivitäten koordinieren
  • Abfrageverarbeitung
    • Nutzt die Architektur der massiven Parallelverarbeitung (MPP)
    • Verteilt Daten und Rechenressourcen über einen Cluster von Knoten (Computern)
  • Datenbankspeicher
    • Speichert Daten in einem spaltenorientierten Format (super für analytische Abfragen).
1 https://docs.snowflake.com/en/user-guide/intro-key-concepts#snowflake-architecture
Einführung in Snowflake

Lass uns üben!

Einführung in Snowflake

Preparing Video For Download...