Numerische Datentypen und deskriptive Funktionen

Explorative Datenanalyse in SQL

Christina Maimone

Data Scientist

Numerische Typen: Ganzzahl (integer)

Name Speichergröße  Beschreibung Spannweite
integer oder int oder int4 4 Bytes typische Wahl                            -2147483648 bis +2147483647                                    
Explorative Datenanalyse in SQL

Numerische Typen: Ganzzahl (integer)

Name Speichergröße  Beschreibung Spannweite
integer oder int oder int4 4 Bytes typische Wahl                            -2147483648 bis +2147483647
smallint oder int2 2 Bytes geringe Spannweite -32768 bis +32767
bigint oder int8 8 Bytes Große Spannweite -9223372036854775808 bis +9223372036854775807
Explorative Datenanalyse in SQL

Numerische Typen: Ganzzahl (integer)

Name Speichergröße  Beschreibung Spannweite
integer oder int oder int4 4 Bytes typische Wahl                            -2147483648 bis +2147483647
smallint oder int2 2 Bytes geringe Spannweite -32768 bis +32767
bigint oder int8 8 Bytes Große Spannweite -9223372036854775808 bis +9223372036854775807
serial 4 Bytes automatische Inkrementierung 1 bis 2147483647
smallserial 2 Bytes kleine automatische Inkrementierung 1 bis 32767
bigserial 8 Bytes große automatische Inkrementierung 1 bis 9223372036854775807
Explorative Datenanalyse in SQL

Numerische Typen: Dezimal

Name Speichergröße Beschreibung Spannweite
decimal oder numeric            Variable benutzerdefinierte Genauigkeit, exakt bis zu 131072 Stellen vor dem Komma; bis zu 16383 Stellen nach dem Komma
Explorative Datenanalyse in SQL

Numerische Typen: Dezimal

Name Speichergröße Beschreibung Spannweite
decimal oder numeric            Variable benutzerdefinierte Genauigkeit, exakt bis zu 131072 Stellen vor dem Komma; bis zu 16383 Stellen nach dem Komma
real 4 Bytes ungenau 6 Dezimalstellen genau
double precision 8 Bytes ungenau 15 Dezimalstellen genau
Explorative Datenanalyse in SQL

Division

-- integer division
SELECT 10/4;
2
-- numeric division
SELECT 10/4.0;
2.500000000
Explorative Datenanalyse in SQL

Spannweite: min und max

SELECT min(question_pct)
  FROM stackoverflow;
 min 
-----
   0
(1 row)

SELECT max(question_pct)
  FROM stackoverflow;
     max     
-------------
 0.071957428
(1 row)
Explorative Datenanalyse in SQL

Durchschnitt oder Mittelwert

SELECT avg(question_pct)
  FROM stackoverflow;
         avg         
---------------------
 0.00379494620059319
(1 row)

Explorative Datenanalyse in SQL

Varianz

Populationsvarianz

SELECT var_pop(question_pct)
  FROM stackoverflow;
       var_pop        
----------------------
 0.000140268640974167
(1 row)

Stichprobenvarianz

SELECT var_samp(question_pct)
  FROM stackoverflow;
       var_samp       
----------------------
 0.000140271571051059
(1 row)
SELECT variance(question_pct)
  FROM stackoverflow;
       variance       
----------------------
 0.000140271571051059
(1 row)
Explorative Datenanalyse in SQL

Standardabweichung

Standardabweichung der Stichprobe

SELECT stddev_samp(question_pct)
  FROM stackoverflow;
     stddev_samp     
--------------------
 0.0118436299778007
(1 row)
SELECT stddev(question_pct)
  FROM stackoverflow;
       stddev       
--------------------
 0.0118436299778007
(1 row)

Populationsstandardabweichung

SELECT stddev_pop(question_pct)
  FROM stackoverflow;
      stddev_pop     
--------------------
 0.0118435062787237
(1 row)
Explorative Datenanalyse in SQL

Runden

SELECT round(42.1256, 2);
42.13
Explorative Datenanalyse in SQL

Nach Gruppen zusammenfassen

-- Summarize by group with GROUP BY
SELECT tag,
       min(question_pct), 
       avg(question_pct), 
       max(question_pct) 
  FROM stackoverflow
 GROUP BY tag;
           tag            |     min     |         avg          |     max     
--------------------------+-------------+----------------------+-------------
 amazon-sqs               |    6.91e-05 | 8.08328877005347e-05 |     9.6e-05
 amazon-kinesis           |     2.1e-05 |  3.3924064171123e-05 |    4.64e-05
 android-pay              |    2.97e-05 | 3.16712477396022e-05 |    3.29e-05
 amazon-cloudformation    |     4.8e-05 | 9.34518997326204e-05 |  0.00015246
 citrix                   |     3.6e-05 | 3.95804407713499e-05 |    4.39e-05
 amazon-ec2               | 0.001058039 |  0.00122817236730946 | 0.001378872
 actionscript             | 0.000551486 |  0.00067589990909091 | 0.000856132
 amazon-ecs               |    1.17e-05 | 3.40544117647059e-05 |    6.51e-05
 mongodb                  |   0.0049625 |  0.00577465885069125 |  0.00631164
 amazon-redshift          | 0.000117294 | 0.000160832181818182 | 0.000212208
...
Explorative Datenanalyse in SQL

Lass uns mit Zahlen arbeiten!

Explorative Datenanalyse in SQL

Preparing Video For Download...