EDA mit kategorialen Variablen

Explorative Datenanalyse in Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Kategoriale Variablen und Häufigkeit

Ein Balkendiagramm mit der Anzahl Teilnehmender (y-Achse) für drei Altersgruppen (x-Achse): „18–29“, „30–39“ und „40–49“. „40–49“ hat die meisten Teilnehmenden.

Explorative Datenanalyse in Power BI

Kategoriale Variablen und Prozente

Ein Kreisdiagramm mit dem prozentualen Anteil Teilnehmender in drei Altersgruppen – „18–29“, „30–39“ und „40–49“. Die letzte Gruppe ist am höchsten mit 39,4 %.

Explorative Datenanalyse in Power BI

Anteile über mehrere kategoriale Variablen

Ein 100-%-gestapeltes Balkendiagramm. Auf der x-Achse drei Altersgruppen: „18–29“, „30–39“, „40–49“. Auf der y-Achse der Prozentanteil. Jeder Balken ist nach Plattform aufgeteilt: Instagram, LinkedIn, TikTok und Twitter.

Explorative Datenanalyse in Power BI

Kategoriale Variablen mit deskriptiven Statistiken

Altersgruppe Median: Stunden/Tag in sozialen Medien
18–29 6
30–39 3
40–49 3
Explorative Datenanalyse in Power BI

Was sind Boxplots?

Ein Boxplot zu Körpergrößen. Die Größe in Zentimetern ist auf der y-Achse.

Explorative Datenanalyse in Power BI

Was sind Boxplots?

Ein Boxplot zu Körpergrößen. Die Größe in Zentimetern ist auf der y-Achse. Eine rote Markierung umgibt die Linie in der Mitte der Box (den Median).

Explorative Datenanalyse in Power BI

Was sind Boxplots?

Ein Boxplot zu Körpergrößen. Die Größe in Zentimetern ist auf der y-Achse. Eine rote Markierung umgibt die „Box“ des Boxplots.

Explorative Datenanalyse in Power BI

Was sind Boxplots?

Ein Boxplot zu Körpergrößen. Die Größe in Zentimetern ist auf der y-Achse. Eine rote Markierung umgibt die vertikalen „Whisker“, die oben und unten von der Box ausgehen.

Explorative Datenanalyse in Power BI

Was sind Boxplots?

Ein Boxplot zu Körpergrößen. Die Größe in Zentimetern ist auf der y-Achse. Eine rote Markierung umgibt die Ausreißer (Punkte) im Boxplot.

Explorative Datenanalyse in Power BI

Verteilungen mit kategorialen Variablen vergleichen

Zwei Boxplots – einer für „male“ und einer für „female“ – zeigen die Größenverteilung je Gruppe. Beide gleich breit, aber der Boxplot für „male“ liegt höher auf der y-Achse.

Explorative Datenanalyse in Power BI

Neue Variablen erstellen

Daten mutieren: neue Variablen erstellen, um Analyse oder Visualisierung zu verfeinern

Explorative Datenanalyse in Power BI

Neue Variablen erstellen

Daten mutieren: neue Variablen erstellen, um Analyse oder Visualisierung zu verfeinern

Alter Altersgruppe
18 Teenager
19 Teenager
20 Junge Erwachsene
21 Junge Erwachsene
30 Erwachsene
31 Erwachsene
40 Mittleres Alter
41 Mittleres Alter

$$ $$ $$

Kursname Kurstyp
Introduction to Power BI Power BI
Unsupervised Learning in R R
DAX in Power BI Power BI
Introduction to Python Python
Explorative Datenanalyse in Power BI

Lass uns üben!

Explorative Datenanalyse in Power BI

Preparing Video For Download...