Tipos de datos de caracteres y problemas comunes

Análisis exploratorio de datos en SQL

Christina Maimone

Data Scientist

Tipos de caracteres de PostgreSQL

character(n) o char(n)

  • Longitud determinada n
  • Se ignoran los espacios finales en las comparaciones.

character varying(n) o varchar(n)

  • Longitud variable hasta un máximo de n

text o varchar

  • Longitud ilimitada
Análisis exploratorio de datos en SQL

Tipos de datos de texto

Categórico

Mar., Martes, Lu, J

camisas, zapatos, sombreros, pantalones

satisfecho, muy satisfecho, insatisfecho

0349-938, 1254-001, 5477-651

rojo, azul, verde, amarillo

Texto no estructurado

Me gusta mucho este producto. Lo uso todos los días. Es mi color favorito.

Hemos rediseñado tu camiseta favorita para mejorarla aún más. Te encantará...

Hace ochenta y siete años, nuestros padres fundaron en este continente una nueva nación, concebida en libertad y dedicada a la proposición de que todos los hombres son creados iguales...

Análisis exploratorio de datos en SQL

Agrupar y contar

SELECT category,        -- categorical variable

       count(*)         -- count rows for each category

  FROM product          -- table

 GROUP BY category;     -- categorical variable


 category | count 
----------+-------
 Banana   |     1
 Apple    |     4
 apple    |     2
  apple   |     1
 banana   |     3
(5 rows)
Análisis exploratorio de datos en SQL

Order: valores más frecuentes

SELECT category,        -- categorical variable

       count(*)         -- count rows for each category

  FROM product          -- table

 GROUP BY category      -- categorical variable

 ORDER BY count DESC;   -- show most frequent values first
 category | count 
----------+-------
 Apple    |     4
 banana   |     3
 apple    |     2
 Banana   |     1
  apple   |     1
(5 rows)
Análisis exploratorio de datos en SQL

Order: valor de categoría

SELECT category,        -- categorical variable

       count(*)         -- count rows for each category

  FROM product          -- table

 GROUP BY category      -- categorical variable

 ORDER BY category;     -- order by categorical variable
 category | count 
----------+-------
  apple   |     1
 Apple    |     4
 Banana   |     1
 apple    |     2
 banana   |     3
(5 rows)

Análisis exploratorio de datos en SQL

Orden alfabético

-- Results

 category | count 
----------+-------
  apple   |     1
 Apple    |     4
 Banana   |     1
 apple    |     2
 banana   |     3
(5 rows)

-- Alphabetical Order:

' ' < 'A' < 'a'
-- From results

' ' < 'A' < 'B' < 'a' < 'b'

Análisis exploratorio de datos en SQL

Problemas habituales

Mayúsculas o minúsculas

    'apple' != 'Apple'

 

Los espacios cuentan.

    ' apple' != 'apple'

    '' != '       '

Las cadenas vacías no son nulas.

    '' != NULL

 

Diferencias de puntuación

    'to-do' != 'to–do'

Análisis exploratorio de datos en SQL

Es hora de examinar algunos datos de texto.

Análisis exploratorio de datos en SQL

Preparing Video For Download...