Dasar transformasi data deret waktu

Analisis Deret Waktu di Power BI

Kevin Barlow

Data Analytics Professional

Konteks dan pentingnya

  • Data deret waktu kini makin umum di berbagai industri.
  • Sistem berbeda punya kebutuhan dan format berbeda.

 

Mockup Arsitektur Data

Analisis Deret Waktu di Power BI

ISO sebagai standar internasional

ISO 8601

  • Standar internasional untuk mengelola data tanggal dan waktu
  • Memungkinkan konversi tanggal dan waktu ke berbagai format
  • Mendukung lokaliasi dan personalisasi sesuai kebutuhan
  • Ubah bidang tanggal dengan FORMAT()

Contoh tanggal:

var date = January 1st 2022 
# US Standard (MM DD YYYY)

var date2 = FORMAT(date, "DD MM YYYY")
# UK Standard
# 1 January 2022

var date3 = FORMAT(date, "YYYY MM DD")
# ISO Standard
# 2022 January 01
1 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations
Analisis Deret Waktu di Power BI

UNIX untuk timestamp presisi tinggi

Waktu UNIX

  • Juga disebut waktu Epoch
  • Jumlah detik sejak Epoch (1 Januari 1970, 00:00:00 UTC)
  • Umumnya dipakai di sistem komputer
  • Mewakili stempel waktu (tanggal dan waktu)

Contoh tanggal dan waktu

1 Januari 2022 06.00.00 UTC

1641016800

1 Januari 2022 18.00.00 UTC

1641060000

1 https://en.wikipedia.org/wiki/Unix_time
Analisis Deret Waktu di Power BI

Memanipulasi tanggal di Power BI

DATEADD()

Memindahkan sejumlah interval waktu dari tanggal acuan.

DATEADD(<dates>,<number_of_intervals>,<interval>)

Contoh:

DATEADD('date', 30, DAY)

var timestamp_PST = 
    DATEADD('timestamp_EST', -3, HOUR)

DATEDIFF()

Menghitung jumlah interval waktu antara dua objek tanggal.

DATEDIFF(<Date1>, <Date2>, <Interval>)

Contoh:

DATEDIFF(DATE(2019,2,1),
        DATE(2020,4,30),
        MONTH)

Result: 14
Analisis Deret Waktu di Power BI

Merangkum data dengan DAX

Deret waktu tidak selalu berinterval tetap; ini bergantung pada cara pengumpulan data. Ini bisa bermasalah:

  • Algoritme dan rumus waktu mengasumsikan interval konsisten
  • Perubahan besar bisa terjadi di antara titik data

Gunakan SUMMARIZE() untuk “menghaluskan” data. Dengan mengagregasi, kita tetap mendapat tren meski ada data hilang atau tidak teratur.

Contoh:

SUMMARIZE('<table>', 
    [group_column(s)], 
    [new aggregated column(s)])

SUMMARIZE('sales', 
    sales[Quarter], 
    sales[Region], 
    "Total Sales", SUM(sales[revenue]))
Analisis Deret Waktu di Power BI

Menangani data hilang

Imputasi - strategi berguna saat kita tahu konteks nilai yang hilang; sering dilakukan di Power Query.

Contoh Imputasi Data

Menghapus data - dipakai saat baris/kolom kehilangan banyak nilai; hindari kecuali jelas menguntungkan analisis

Contoh Penghapusan Data

Analisis Deret Waktu di Power BI

Dataset Superstore

Pada latihan berikut, Anda akan melihat dataset Superstore. Dataset ini merepresentasikan data Point of Sale (PoS) untuk lokasi Superstore di seluruh Amerika Serikat. Anda akan memformat tanggal ke format yang benar untuk analisis lanjutan.

Data Superstore

Analisis Deret Waktu di Power BI

Ayo berlatih!

Analisis Deret Waktu di Power BI

Preparing Video For Download...