Datenmodellierung und Tabelleneigenschaften

Datenmodellierung in Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Was ist ein Datenmodell?

  • Konzeptionelle Darstellung der Datenelemente
  • In der Regel eine visuelle Darstellung
  • Datenmodelle umfassen:
    • Tabellen
    • Spalten
    • Beziehungen zwischen Tabellen
    • Datentypen
    • Schlüssel

Allgemeiner Überblick über ein Datenmodell

Datenmodellierung in Power BI

Datenmodellierung

  • Der Prozess der Erstellung eines Datenmodells

  • Warum modelliert man Daten?

    • Daten $\neq$ perfekt
    • Daten für die Analyse umgestalten
    • Datenverbrauch komprimieren
    • Einfacher zu verstehendes Modell

 

data modeling

Datenmodellierung in Power BI

Datenmodellierung in Power BI und Power Query

  • Power Query ist das Tool zur Datenvorbereitung für verschiedene Microsoft-Produkte, darunter Power BI.

  • Hauptziele:

    • Abfragen verwalten
    • Datenmodellierung
  • Datenmodellierung: 80 % in Power Query, 20 % in Power BI

Datenmodellierung in Power Query

Datenmodellierung in Power BI

Verwaltung von Spalten und Zeilen

Aktion

  • Bestimmte Spalten behalten oder löschen
  • Bestimmte Zeilen behalten oder löschen
  • Eine einzelne Spalte in mehrere Spalten aufteilen
  • Zeilen in einer Tabelle anhand des Inhalts einer Spalte zusammenfassen/gruppieren

Beispiel

  • Leere Spalte löschen
  • Die oberste Zeile als Kopfzeile behalten
  • DD/MM/YYYY-Spalte in DD-, MM- und YYYY-Spalten aufteilen
  • Summe oder Median aller Zeilen
Datenmodellierung in Power BI

Datentypen

  • Die Wahl des richtigen Datentyps ist sehr wichtig:

    • Daten auf ein bestimmtes Format beschränken
    • Speicherplatz optimieren
    • Bestimmte Funktionen ermöglichen
  • Power Query versucht den Datentyp anhand der ersten paar hundert Zeilen abzuleiten

Datentypen in Power BI

Datenmodellierung in Power BI

Runden

Power Query

  • Verändert die eigentlichen Daten, und nicht nur das Format.
  • Normalerweise nicht die richtige Vorgehensweise

 

Power BI

  • Verändert, wie die Daten angezeigt werden, nicht wie sie gespeichert sind.
  • In der Regel eine bessere Lösung als das Runden in Power Query.

 

Datenmodellierung in Power BI

Der Datensatz

  • Daten von Herstellern aus einer Umfrage des US-amerikanischen Statistikamtes
  • Deskriptive Statistiken von Produktionsfirmen
  • North American Industry Classification System (NAICS)

Datenmodellierung in Power BI

Lass uns üben!

Datenmodellierung in Power BI

Preparing Video For Download...