Datenintelligenz-Plattform – Daten

Einführung in Databricks

Kevin Barlow

Data Analytics Practitioner

Warum ist Datenmanagement für Unternehmen wichtig?

Schutz und Sicherheit

Datensicherheit

Vertrauen in Daten

Zuverlässige Analysen

Einführung in Databricks

Arten von Daten

Strukturiert
  • Am häufigsten und am besten verstanden
  • Typische Zeilen und Spalten
  • Beispiele:
    • Datenbank-Tabellen
    • .csv
    • Parquet
    • Delta
ID Name Beruf Standort:
1 Kevin Data Scientists Kalifornien
2 Tom Architekt Arizona
3 Sally Anwalt Texas
4 Tina Chirurg Florida
5 Joe Ingenieur New York
Einführung in Databricks

Arten von Daten

Semistrukturiert
  • Häufig bei webbasierten Geräten
  • Ein bisschen Struktur, aber flexibler im Inhalt
  • Beispiele:
    • JSON
    • XML
    • HTML
{
  "people": [{
      "id": 1,
      "name": "Kevin",
      "occupation": "Data Scientist",
      "location": "California"},
    {
      "id": 2,
      "name": "Tom",
      "occupation": "Architect",
      "location": "Arizona"}]
}
Einführung in Databricks

Arten von Daten

Unstrukturiert
  • Häufig bei Smart-Geräten, Kameras usw.
  • Wenig Struktur, viele Infos
  • Beispiele:
    • JPEG
    • PNG
    • MP4
    • PDF
    • DOC

Diagramm für unstrukturierte Daten

Einführung in Databricks

Delta

delta.io

  • Open-Source-Speicherformat
  • Sammlung von Parkett-Tabellen
  • JSON-Transaktionsprotokoll
  • Vollständig ACID-konform
  • Batch- und Streaming-Datensätze

Delta Lake

Einführung in Databricks

Unity-Katalog

Unity-Katalogdatenmodell

1 https://docs.databricks.com/en/data-governance/unity-catalog/index.html#the-unity-catalog-object-model
Einführung in Databricks

Unity-Katalog

Unity-Katalogdatenmodell

GRANT, SHOW, REVOKE, USE ...

Einführung in Databricks

Katalog-Explorer

  • Ein einziger Ort, um alle Datenbestände zu erkunden
  • Benutzeroberfläche zum Entdecken von Daten
  • Unity Catalog-Berechtigungen verwalten
  • Datenherkunft und zugehörige Assets anzeigen

Screenshot des Katalog-Explorers

Einführung in Databricks

Lass uns üben!

Einführung in Databricks

Preparing Video For Download...