Más funciones de resumen

Análisis exploratorio de datos en SQL

Christina Maimone

Data Scientist

Correlación

Diagramas de dispersión de puntos de datos con correlaciones positivas y negativas

Análisis exploratorio de datos en SQL

Función de correlación

SELECT corr(assets, equity) 
  FROM fortune500;
       corr        
-------------------
 0.637710143588615
(1 row)
Análisis exploratorio de datos en SQL

Mediana

1 1 4 4 4 5 6 7 13 19 20 20 21 21 22
              ^
            median
        50th percentile

^                                  ^
0th percentile      100th percentile
Análisis exploratorio de datos en SQL

Funciones percentiles

SELECT percentile_disc(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;

-- percentile between 0 and 1
  • Devuelve un valor de la columna

 

SELECT percentile_cont(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;
  • Interpola entre valores
Análisis exploratorio de datos en SQL

Ejemplos de percentiles

SELECT val
  FROM nums;
 val 
-----
   1
   3
   4
   5
(4 rows)
SELECT percentile_disc(.5) WITHIN GROUP (ORDER BY val),
       percentile_cont(.5) WITHIN GROUP (ORDER BY val)
  FROM nums;
 percentile_disc | percentile_cont 
-----------------+-----------------
               3 |             3.5
Análisis exploratorio de datos en SQL

Problemas comunes

  • Códigos de error
    • Ejemplos: 9, 99, -99
  • Códigos de valores ausentes
    • NA, NaN, N/A, #N/A
    • ¿0 = ausente o 0?
  • Valores atípicos (extremos)
    • ¿Muy alto o muy bajo?
    • ¿Valores negativos?
  • No es realmente un número.
    • Ejemplos: códigos postales, categorías de respuestas a encuestas.
Análisis exploratorio de datos en SQL

¡Vamos a practicar!

Análisis exploratorio de datos en SQL

Preparing Video For Download...