EDA avec des variables catégorielles

Analyse exploratoire des données dans Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Variables catégorielles et fréquences

Un histogramme en barres du nombre de participants (axe des y) pour trois tranches d’âge (axe des x) : « 18-29 », « 30-39 » et « 40-49 », cette dernière ayant le plus de participants.

Analyse exploratoire des données dans Power BI

Variables catégorielles et pourcentages

Un diagramme circulaire montrant le pourcentage de participants dans trois tranches d’âge — « 18-29 », « 30-39 » et « 40-49 ». Cette dernière a le pourcentage le plus élevé, 39,4 %.

Analyse exploratoire des données dans Power BI

Proportions sur plusieurs variables catégorielles

Un histogramme en barres empilées à 100 %. Trois tranches d’âge sur l’axe des x : « 18-29 », « 30-39 », « 40-49 ». Pourcentage de participants sur l’axe des y. Chaque barre est ventilée par la part sur quatre réseaux sociaux : Instagram, LinkedIn, TikTok et Twitter.

Analyse exploratoire des données dans Power BI

Variables catégorielles avec statistiques descriptives

Tranche d’âge Heures médianes/jour sur les réseaux sociaux
18-29 6
30-39 3
40-49 3
Analyse exploratoire des données dans Power BI

Qu’est-ce qu’un boxplot ?

Un boîte à moustaches des tailles de personnes. Les tailles, en centimètres, sont sur l’axe des y.

Analyse exploratoire des données dans Power BI

Qu’est-ce qu’un boxplot ?

Un boîte à moustaches des tailles de personnes. Les tailles, en centimètres, sont sur l’axe des y. Un contour rouge entoure la ligne au centre de la boîte, la médiane.

Analyse exploratoire des données dans Power BI

Qu’est-ce qu’un boxplot ?

Un boîte à moustaches des tailles de personnes. Les tailles, en centimètres, sont sur l’axe des y. Un contour rouge entoure la « boîte » du boxplot.

Analyse exploratoire des données dans Power BI

Qu’est-ce qu’un boxplot ?

Un boîte à moustaches des tailles de personnes. Les tailles, en centimètres, sont sur l’axe des y. Un contour rouge entoure les moustaches verticales en haut et en bas de la boîte.

Analyse exploratoire des données dans Power BI

Qu’est-ce qu’un boxplot ?

Un boîte à moustaches des tailles de personnes. Les tailles, en centimètres, sont sur l’axe des y. Un contour rouge entoure les valeurs aberrantes, les points, sur le boxplot.

Analyse exploratoire des données dans Power BI

Comparer des distributions avec des variables catégorielles

Deux boxplots — un pour hommes et un pour femmes — montrant la distribution des tailles dans chaque groupe. Les deux ont la même taille, mais celui des « hommes » est plus haut sur l’axe des y.

Analyse exploratoire des données dans Power BI

Créer de nouvelles variables

Mutation des données : créer de nouvelles variables pour affiner l’analyse ou la visualisation

Analyse exploratoire des données dans Power BI

Créer de nouvelles variables

Mutation des données : créer de nouvelles variables pour affiner l’analyse ou la visualisation

Âge Tranche d’âge
18 Adolescent
19 Adolescent
20 Jeune adulte
21 Jeune adulte
30 Adulte
31 Adulte
40 Âge mûr
41 Âge mûr

$$ $$ $$

Titre du cours Type de cours
Introduction à Power BI Power BI
Apprentissage non supervisé en R R
DAX dans Power BI Power BI
Introduction à Python Python
Analyse exploratoire des données dans Power BI

Passons à la pratique !

Analyse exploratoire des données dans Power BI

Preparing Video For Download...