EDA com variáveis categóricas

Análise Exploratória de Dados no Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Variáveis categóricas e frequência

Um gráfico de barras com o número de participantes (eixo y) para três faixas etárias (eixo x): “18-29”, “30-39” e “40-49”, que tem mais participantes na amostra.

Análise Exploratória de Dados no Power BI

Variáveis categóricas e porcentagens

Um gráfico de pizza mostrando a porcentagem de participantes em três faixas etárias — “18-29”, “30-39” e “40-49”. A última tem a maior porcentagem, 39,4%.

Análise Exploratória de Dados no Power BI

Proporções em múltiplas variáveis categóricas

Um gráfico de barras empilhadas 100%. Três faixas etárias no eixo x: “18-29”, “30-39”, “40-49”. Porcentagem de participantes no eixo y. Cada barra é dividida pela porcentagem do grupo em quatro redes sociais — Instagram, LinkedIn, TikTok e Twitter.

Análise Exploratória de Dados no Power BI

Variáveis categóricas com estatísticas descritivas

Faixa etária Mediana de horas/dia em redes sociais
18-29 6
30-39 3
40-49 3
Análise Exploratória de Dados no Power BI

O que são boxplots?

Um boxplot de alturas de pessoas. Alturas, em centímetros, no eixo y.

Análise Exploratória de Dados no Power BI

O que são boxplots?

Um boxplot de alturas de pessoas. Alturas, em centímetros, no eixo y. Um contorno vermelho destaca a linha no centro da caixa, a mediana.

Análise Exploratória de Dados no Power BI

O que são boxplots?

Um boxplot de alturas de pessoas. Alturas, em centímetros, no eixo y. Um contorno vermelho destaca a “caixa” do boxplot.

Análise Exploratória de Dados no Power BI

O que são boxplots?

Um boxplot de alturas de pessoas. Alturas, em centímetros, no eixo y. Um contorno vermelho destaca os “bigodes” verticais saindo do topo e da base da caixa.

Análise Exploratória de Dados no Power BI

O que são boxplots?

Um boxplot de alturas de pessoas. Alturas, em centímetros, no eixo y. Um contorno vermelho destaca os outliers, os pontos no boxplot.

Análise Exploratória de Dados no Power BI

Comparando distribuições com variáveis categóricas

Dois boxplots — um para masculino e outro para feminino — mostrando a distribuição das alturas em cada grupo. Ambos têm tamanho igual, mas o de “masculino” está mais alto no eixo y.

Análise Exploratória de Dados no Power BI

Criando novas variáveis

Mutação de dados: criar novas variáveis para refinar a análise ou a visualização

Análise Exploratória de Dados no Power BI

Criando novas variáveis

Mutação de dados: criar novas variáveis para refinar a análise ou a visualização

Idade Faixa etária
18 Adolescente
19 Adolescente
20 Adulto jovem
21 Adulto jovem
30 Adulto
31 Adulto
40 Meia-idade
41 Meia-idade

$$ $$ $$

Título do curso Tipo de curso
Introduction to Power BI Power BI
Unsupervised Learning in R R
DAX in Power BI Power BI
Introduction to Python Python
Análise Exploratória de Dados no Power BI

Vamos praticar!

Análise Exploratória de Dados no Power BI

Preparing Video For Download...