Satır ve sütun veri deposu
Veri Ambarı Kavramları
Aaren Stubberfield
Data Scientist
Neden önemli?
- Sorguları hız için optimize etme
- Veri ambarı tabloları için sütun depo biçimi analitik iş yükleri açısından en iyisidir
Bilgisayar depolamanın temelleri
- Bilgisayarlar veriyi bloklarda saklar.
- Veriyi alırken gerekli blokları okur.
- Daha az blok okumak genel hızı artırır.
Sağlık tablosu örneği
- CDC (Hastalık Kontrol ve Önleme Merkezleri)
- Birden çok sezonda yaş gruplarına göre grip enfeksiyonu verileri
| SEZON |
YAŞ GRUBU |
HASTANEYE YATIŞ YÜZDESİ |
| 2019 |
0-17 yıl |
%13,9 |
| 2019 |
18-49 yıl |
%22,5 |
| 2019 |
50+ yıl |
%63,7 |
| 2020 |
0-17 yıl |
%3,9 |
| 2020 |
18-49 yıl |
%18,1 |
| 2020 |
50+ yıl |
%78 |
| 2021 |
0-17 yıl |
%15,6 |
| 2021 |
18-49 yıl |
%23,3 |
| 2021 |
50+ yıl |
%61,1 |
Satır deposu örneği
| SEZON |
YAŞ GRUBU |
HASTANEYE YATIŞ YÜZDESİ |
| 2019 |
0-17 yıl |
%13,9 |
| 2019 |
18-49 yıl |
%22,5% |
| 2019 |
50+ yıl |
%63,7 |
| 2020 |
0-17 yıl |
%3,9 |
| 2020 |
18-49 yıl |
%18,1 |
| 2020 |
50+ yıl |
%78 |
| 2021 |
0-17 yıl |
%15,6 |
| 2021 |
18-49 yıl |
%23,3 |
| 2021 |
50+ yıl |
%61,1 |
Sütun deposu örneği
| SEZON |
YAŞ GRUBU |
HASTANEYE YATIŞ YÜZDESİ |
| 2019 |
0-17 yıl |
%13,9 |
| 2019 |
18-49 yıl |
%22,5 |
| 2019 |
50+ yıl |
%63,7 |
| 2020 |
0-17 yıl |
%3,9 |
| 2020 |
18-49 yıl |
%18,1 |
| 2020 |
50+ yıl |
%78 |
| 2021 |
0-17 yıl |
%15,6 |
| 2021 |
18-49 yıl |
%23,3 |
| 2021 |
50+ yıl |
%61,1 |
Özet
Satır Deposu
- Satır verileri bloklarda birlikte saklanır
- İşlemsel iş yükleri için idealdir
Sütun Deposu
- Sütun verileri bloklarda birlikte saklanır
- Analitik iş yükleri için idealdir
- Daha iyi veri sıkıştırma
Hadi pratik yapalım!
Veri Ambarı Kavramları
Preparing Video For Download...