Tipos de dados numéricos e funções de resumo

Análise Exploratória de Dados em SQL

Christina Maimone

Data Scientist

Tipos numéricos: integer

Nome Tamanho do armazenamento Descrição Faixa
integer ou int ou int4 4 bytes escolha típica                            -2147483648 a +2147483647                                    
Análise Exploratória de Dados em SQL

Tipos numéricos: integer

Nome Tamanho do armazenamento Descrição Faixa
integer ou int ou int4 4 bytes escolha típica                            -2147483648 a +2147483647
smallint ou int2 2 bytes faixa pequena -32768 a +32767
bigint ou int8 8 bytes faixa grande -9223372036854775808 a +9223372036854775807
Análise Exploratória de Dados em SQL

Tipos numéricos: integer

Nome Tamanho do armazenamento Descrição Faixa
integer ou int ou int4 4 bytes escolha típica                            -2147483648 a +2147483647
smallint ou int2 2 bytes faixa pequena -32768 a +32767
bigint ou int8 8 bytes faixa grande -9223372036854775808 a +9223372036854775807
serial 4 bytes autoincremento 1 a 2147483647
smallserial 2 bytes autoincremento pequeno 1 a 32767
bigserial 8 bytes autoincremento grande 1 a 9223372036854775807
Análise Exploratória de Dados em SQL

Tipos numéricos: decimal

Nome Tamanho do armazenamento Descrição Faixa
decimal ou numeric            variável precisão definida pelo usuário, exato até 131.072 dígitos antes da vírgula decimal; até 16.383 dígitos depois da vírgula decimal
Análise Exploratória de Dados em SQL

Tipos numéricos: decimal

Nome Tamanho do armazenamento Descrição Faixa
decimal ou numeric            variável precisão definida pelo usuário, exato até 131.072 dígitos antes da vírgula decimal; até 16.383 dígitos depois da vírgula decimal
real 4 bytes precisão variável, inexato precisão de 6 dígitos decimais
double precision 8 bytes precisão variável, inexato precisão de 15 dígitos decimais
Análise Exploratória de Dados em SQL

Divisão

-- integer division
SELECT 10/4;
2
-- numeric division
SELECT 10/4.0;
2.500000000
Análise Exploratória de Dados em SQL

Faixa: mínima e máxima

SELECT min(question_pct)
  FROM stackoverflow;
 min 
-----
   0
(1 row)

SELECT max(question_pct)
  FROM stackoverflow;
     max     
-------------
 0.071957428
(1 row)
Análise Exploratória de Dados em SQL

Média ou média aritmética

SELECT avg(question_pct)
  FROM stackoverflow;
         avg         
---------------------
 0.00379494620059319
(1 row)

Análise Exploratória de Dados em SQL

Variância

Variância populacional

SELECT var_pop(question_pct)
  FROM stackoverflow;
       var_pop        
----------------------
 0.000140268640974167
(1 row)

Variância amostral

SELECT var_samp(question_pct)
  FROM stackoverflow;
       var_samp       
----------------------
 0.000140271571051059
(1 row)
SELECT variance(question_pct)
  FROM stackoverflow;
       variance       
----------------------
 0.000140271571051059
(1 row)
Análise Exploratória de Dados em SQL

Desvio padrão

Desvio padrão da amostra

SELECT stddev_samp(question_pct)
  FROM stackoverflow;
     stddev_samp     
--------------------
 0.0118436299778007
(1 row)
SELECT stddev(question_pct)
  FROM stackoverflow;
       stddev       
--------------------
 0.0118436299778007
(1 row)

Desvio padrão da população

SELECT stddev_pop(question_pct)
  FROM stackoverflow;
      stddev_pop     
--------------------
 0.0118435062787237
(1 row)
Análise Exploratória de Dados em SQL

Arredondar

SELECT round(42.1256, 2);
42.13
Análise Exploratória de Dados em SQL

Resumir por grupo

-- Summarize by group with GROUP BY
SELECT tag,
       min(question_pct), 
       avg(question_pct), 
       max(question_pct) 
  FROM stackoverflow
 GROUP BY tag;
           tag            |     min     |         avg          |     max     
--------------------------+-------------+----------------------+-------------
 amazon-sqs               |    6.91e-05 | 8.08328877005347e-05 |     9.6e-05
 amazon-kinesis           |     2.1e-05 |  3.3924064171123e-05 |    4.64e-05
 android-pay              |    2.97e-05 | 3.16712477396022e-05 |    3.29e-05
 amazon-cloudformation    |     4.8e-05 | 9.34518997326204e-05 |  0.00015246
 citrix                   |     3.6e-05 | 3.95804407713499e-05 |    4.39e-05
 amazon-ec2               | 0.001058039 |  0.00122817236730946 | 0.001378872
 actionscript             | 0.000551486 |  0.00067589990909091 | 0.000856132
 amazon-ecs               |    1.17e-05 | 3.40544117647059e-05 |    6.51e-05
 mongodb                  |   0.0049625 |  0.00577465885069125 |  0.00631164
 amazon-redshift          | 0.000117294 | 0.000160832181818182 | 0.000212208
...
Análise Exploratória de Dados em SQL

Vamos trabalhar com números!

Análise Exploratória de Dados em SQL

Preparing Video For Download...