Análisis exploratorio de datos en SQL
Christina Maimone
Data Scientist
character(n) o char(n)
ncharacter varying(n) o varchar(n)
ntext o varchar
Categórico
Mar., Martes, Lu, J
camisas, zapatos, sombreros, pantalones
satisfecho, muy satisfecho, insatisfecho
0349-938, 1254-001, 5477-651
rojo, azul, verde, amarillo
Texto no estructurado
Me gusta mucho este producto. Lo uso todos los días. Es mi color favorito.
Hemos rediseñado tu camiseta favorita para mejorarla aún más. Te encantará...
Hace ochenta y siete años, nuestros padres fundaron en este continente una nueva nación, concebida en libertad y dedicada a la proposición de que todos los hombres son creados iguales...
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category; -- categorical variable
category | count
----------+-------
Banana | 1
Apple | 4
apple | 2
apple | 1
banana | 3
(5 rows)
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category -- categorical variable
ORDER BY count DESC; -- show most frequent values first
category | count
----------+-------
Apple | 4
banana | 3
apple | 2
Banana | 1
apple | 1
(5 rows)
SELECT category, -- categorical variable
count(*) -- count rows for each category
FROM product -- table
GROUP BY category -- categorical variable
ORDER BY category; -- order by categorical variable
category | count
----------+-------
apple | 1
Apple | 4
Banana | 1
apple | 2
banana | 3
(5 rows)
-- Results
category | count
----------+-------
apple | 1
Apple | 4
Banana | 1
apple | 2
banana | 3
(5 rows)
-- Alphabetical Order:
' ' < 'A' < 'a'
-- From results
' ' < 'A' < 'B' < 'a' < 'b'
Mayúsculas o minúsculas
'apple' != 'Apple'
Los espacios cuentan.
' apple' != 'apple'
'' != ' '
Las cadenas vacías no son nulas.
'' != NULL
Diferencias de puntuación
'to-do' != 'to–do'
Análisis exploratorio de datos en SQL