Mais funções de resumo

Análise Exploratória de Dados em SQL

Christina Maimone

Data Scientist

Correlação

Gráficos de dispersão de pontos de dados com correlações positivas e negativas

Análise Exploratória de Dados em SQL

Função de correlação

SELECT corr(assets, equity) 
  FROM fortune500;
       corr        
-------------------
 0.637710143588615
(1 row)
Análise Exploratória de Dados em SQL

Mediana

1 1 4 4 4 5 6 7 13 19 20 20 21 21 22
              ^
            median
        50th percentile

^                                  ^
0th percentile      100th percentile
Análise Exploratória de Dados em SQL

Funções percentuais

SELECT percentile_disc(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;

-- percentile between 0 and 1
  • Retorna um valor da coluna

 

SELECT percentile_cont(percentile) WITHIN GROUP (ORDER BY column_name)
  FROM table;
  • Interpola entre valores
Análise Exploratória de Dados em SQL

Exemplos de percentis

SELECT val
  FROM nums;
 val 
-----
   1
   3
   4
   5
(4 rows)
SELECT percentile_disc(.5) WITHIN GROUP (ORDER BY val),
       percentile_cont(.5) WITHIN GROUP (ORDER BY val)
  FROM nums;
 percentile_disc | percentile_cont 
-----------------+-----------------
               3 |             3.5
Análise Exploratória de Dados em SQL

Problemas comuns

  • Códigos de erro
    • Exemplos: 9, 99, -99
  • Códigos de valores ausentes
    • NA, NaN, N/A, #N/A
    • 0 = ausente ou 0?
  • Valores discrepantes (extremos)
    • Muito alto ou muito baixo?
    • Valores negativos?
  • Não é bem um número
    • Exemplos: códigos postais, categorias de respostas a pesquisas
Análise Exploratória de Dados em SQL

Vamos praticar!

Análise Exploratória de Dados em SQL

Preparing Video For Download...