Relaties tussen continue variabelen

Exploratory Data Analysis in Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Wat zijn scatterplots?

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as.

Exploratory Data Analysis in Power BI

Wat zijn scatterplots?

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. Twee rode rechthoeken lichten de x- en y-as uit.

Exploratory Data Analysis in Power BI

Wat zijn scatterplots?

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. Een rode rechthoek licht het diagramgebied en de punten uit.

Exploratory Data Analysis in Power BI

Een scatterplot interpreteren

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. De punten clusteren dicht bij de oorsprong en spreiden meer uit bij hogere waarden van "Total Bill" en "Tip".

Exploratory Data Analysis in Power BI

Een scatterplot interpreteren

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. Een rode lijn snijdt door de cluster van punten en toont een stijgende trend.

Exploratory Data Analysis in Power BI

Een scatterplot interpreteren

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. De punten clusteren dicht bij de oorsprong en spreiden meer uit bij hogere waarden van "Total Bill" en "Tip".

Exploratory Data Analysis in Power BI

Een scatterplot interpreteren

Sterk positief

Een scatterplot met een rode lijn die een positieve, stijgende relatie toont. Een rode cirkel markeert de punten; ze liggen dicht bij elkaar.

Sterk negatief

Een scatterplot met een rode lijn die een negatieve, dalende relatie toont. Een rode cirkel markeert de punten; ze liggen dicht bij elkaar.

Zwak positief

Een scatterplot met een rode lijn die een positieve, stijgende relatie toont. Een rode cirkel markeert de punten; ze liggen meer verspreid en de relatie is dus zwak.

Geen relatie

Een scatterplot met een rode lijn die vlak is, dus geen relatie. Een rode cirkel markeert de punten; ze liggen meer verspreid en de relatie is dus zwak.

Exploratory Data Analysis in Power BI

Correlatiecoëfficiënt

  • Gebruikt om de relatie te kwantificeren
  • Aangeduid met de letter r

$$

r = Omschrijving relatie
-1 Sterk negatief
0 Geen relatie
1 Sterk positief

$$

Het berekenen van de correlatiecoëfficiënt valt buiten deze cursus

Exploratory Data Analysis in Power BI

Correlatiecoëfficiënt en scatterplots

Sterk positief r=0,9

Een scatterplot met een rode lijn die een positieve, stijgende relatie toont. Een rode cirkel markeert de punten; ze liggen dicht bij elkaar.

Sterk negatief r=-0,9

Een scatterplot met een rode lijn die een negatieve, dalende relatie toont. Een rode cirkel markeert de punten; ze liggen dicht bij elkaar.

Zwak positief r=0,35

Een scatterplot met een rode lijn die een positieve, stijgende relatie toont. Een rode cirkel markeert de punten; ze liggen meer verspreid en de relatie is dus zwak.

Geen relatie r=0,0

Een scatterplot met een rode lijn die vlak is, dus geen relatie. Een rode cirkel markeert de punten; ze liggen meer verspreid en de relatie is dus zwak.

Exploratory Data Analysis in Power BI

Context toevoegen aan een scatterplot

Een scatterplot met "Total Bill" op de x-as en "Tip" op de y-as. "Party Size" kleurt de punten op basis van de waarde. Bijv. groepsgrootte 1 is donkerblauw en 6 is felgeel.

Exploratory Data Analysis in Power BI

Laten we oefenen!

Exploratory Data Analysis in Power BI

Preparing Video For Download...