Spreidingsdiagrammen

Data­visualisatie begrijpen

Richie Cotton

Data Evangelist at DataCamp

Wanneer gebruik je een spreidingsdiagram?

  1. Je hebt twee continue variabelen.
  2. Je wilt vragen beantwoorden over hun onderlinge relatie.
Data­visualisatie begrijpen

Huizenprijzen in Los Angeles County

city n_beds price_musd area_sqft
Long Beach 1 0.3250 846
Beverly Hills 3 2.1950 2930
Santa Monica 2 0.5740 1037
Santa Monica 1 0.5990 576
Beverly Hills 5 3.9500 5600
Long Beach 4 0.2999 1571
Westwood 3 0.6950 1913
Data­visualisatie begrijpen

Prijs vs. oppervlak

Een spreidingsdiagram van huizenprijzen vs. woonoppervlak in Los Angeles, met lineaire schalen op beide assen.

Een spreidingsdiagram van huizenprijzen vs. woonoppervlak in Los Angeles, met logaritmische schalen op beide assen.

Data­visualisatie begrijpen

Correlatie

Hoe dicht kun je een rechte lijn door de punten trekken?

Een spreidingsdiagram met correlaties voor theoretische paren van x- en y-coördinaten.

Data­visualisatie begrijpen

Soms helpt correlatie niet

Spreidingsdiagrammen van de 13 datasets in de Dinosaurus Dozijn. Elke dataset ziet er heel anders uit.

Data­visualisatie begrijpen

Trendlijnen toevoegen

Een spreidingsdiagram van huizenprijzen vs. woonoppervlak in Los Angeles, met logaritmische schalen op beide assen. Er is een lineaire trendlijn toegevoegd die goed past.

Data­visualisatie begrijpen

Gladde trendlijnen toevoegen

Een spreidingsdiagram van huizenprijzen vs. woonoppervlak in Los Angeles, met lineaire schalen op beide assen. Er is een lineaire trendlijn toegevoegd die slecht past.

Een spreidingsdiagram van huizenprijzen vs. woonoppervlak in Los Angeles, met lineaire schalen op beide assen. Er is een LOESS-trendlijn toegevoegd die goed past.

Data­visualisatie begrijpen

Laten we oefenen!

Data­visualisatie begrijpen

Preparing Video For Download...