Análise Exploratória de Dados em SQL
Christina Maimone
Data Scientist
character(n) ou char(n)
ncharacter varying(n) ou varchar(n)
ntext ou varchar
Categórico
Tues, Tuesday, Mon, TH
camisas, sapatos, chapéus, calças
satisfeito, muito satisfeito, insatisfeito
0349-938, 1254-001, 5477-651
vermelho, azul, verde, amarelo
Texto não estruturado
Gosto muito desse produto. Uso isso todo dia. É minha cor favorita.
Redesenhamos sua camiseta favorita para deixá-la ainda melhor. Você vai amar...
Há oitenta e sete anos, nossos pais fundaram neste continente uma nova nação, concebida na Liberdade e dedicada ao princípio de que todos os homens são criados iguais...
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category; -- categorical variable
category | count
----------+-------
Banana | 1
Apple | 4
apple | 2
apple | 1
banana | 3
(5 rows)
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category -- categorical variable
ORDER BY count DESC; -- show most frequent values first
category | count
----------+-------
Apple | 4
banana | 3
apple | 2
Banana | 1
apple | 1
(5 rows)
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category -- categorical variable
ORDER BY category; -- order by categorical variable
category | count
----------+-------
apple | 1
Apple | 4
Banana | 1
apple | 2
banana | 3
(5 rows)
-- Results
category | count
----------+-------
apple | 1
Apple | 4
Banana | 1
apple | 2
banana | 3
(5 rows)
-- Alphabetical Order:
' ' < 'A' < 'a'
-- From results
' ' < 'A' < 'B' < 'a' < 'b'
Diferencia maiúsculas de minúsculas
'apple' != 'Apple'
Espaços contam
' apple' != 'apple'
'' != ' '
Strings vazias não são nulas
'' != NULL
Diferenças de pontuação
'to-do' != 'to–do'
Análise Exploratória de Dados em SQL