Diagrammes en nuages de points

Comprendre la visualisation des données

Richie Cotton

Data Evangelist at DataCamp

Quand devriez-vous utiliser un diagramme en nuage de points ?

  1. Vous avez deux variables continues.
  2. Vous souhaitez répondre à des questions sur la relation entre les deux variables.
Comprendre la visualisation des données

Prix des logements à Los Angeles County

city n_beds price_musd area_sqft
Long Beach 1 0.3250 846
Beverly Hills 3 2.1950 2930
Santa Monica 2 0.5740 1037
Santa Monica 1 0.5990 576
Beverly Hills 5 3.9500 5600
Long Beach 4 0.2999 1571
Westwood 3 0.6950 1913
Comprendre la visualisation des données

Prix en fonction de la superficie

Diagramme en nuage de points des prix des logements à Los Angeles en fonction de leur superficie, en utilisant des échelles linéaires sur les axes x et y.

Diagramme en nuage de points des prix des logements à Los Angeles en fonction de leur superficie, en utilisant des échelles logarithmiques sur les axes x et y.

Comprendre la visualisation des données

Corrélation

Dans quelle mesure pouvez-vous tracer une ligne droite passant par les points ?

Un diagramme en nuage de points des corrélations pour des paires théoriques de coordonnées x et y.

Comprendre la visualisation des données

Parfois, la corrélation n’est pas utile

Diagrammes en nuages de points des 13 ensembles de données de Dinosaurus Dozen. Chaque ensemble de données est très différent des autres.

Comprendre la visualisation des données

Ajout de lignes de tendance

Diagramme en nuage de points des prix des logements à Los Angeles en fonction de leur superficie, en utilisant des échelles logarithmiques sur les axes x et y. Une ligne de tendance linéaire a été ajoutée, ce qui constitue un bon ajustement.

Comprendre la visualisation des données

Ajout de lignes de tendance lisses

Diagramme en nuage de points des prix des logements à Los Angeles en fonction de leur superficie, en utilisant des échelles linéaires sur les axes x et y. Une ligne de tendance linéaire a été ajoutée, mais elle ne constitue pas un bon ajustement.

Diagramme en nuage de points des prix des logements à Los Angeles en fonction de leur superficie, en utilisant des échelles linéaires sur les axes x et y. Une ligne de tendance LOESS (régression locale) a été ajoutée, qui constitue un bon ajustement.

Comprendre la visualisation des données

Passons à la pratique !

Comprendre la visualisation des données

Preparing Video For Download...