Basis van transformatie van tijdreeksgegevens

Tijdreeksanalyse in Power BI

Kevin Barlow

Data Analytics Professional

Context en belang

  • Tijdreeksdata komt in elke sector steeds vaker voor.
  • Systemen hebben uiteenlopende eisen en formaten.

 

Mockup data-architectuur

Tijdreeksanalyse in Power BI

ISO als internationale standaard

ISO 8601

  • Internationale standaard voor datum- en tijdgegevens
  • Maakt omzetting van datums en tijden naar andere formaten mogelijk
  • Ondersteunt lokalisatie en personalisatie
  • Bewerk je datumveld met FORMAT()

Voorbeelddatum:

var date = January 1st 2022 
# US Standard (MM DD YYYY)

var date2 = FORMAT(date, "DD MM YYYY")
# UK Standard
# 1 January 2022

var date3 = FORMAT(date, "YYYY MM DD")
# ISO Standard
# 2022 January 01
1 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations
Tijdreeksanalyse in Power BI

UNIX voor zeer precieze timestamps

UNIX-tijd

  • Ook wel Epoch-tijd
  • Aantal seconden sinds de Epoch (1 januari 1970, 00:00:00 UTC)
  • Gebruikt vooral in computersystemen
  • Stelt een timestamp voor (datum en tijd)

Voorbeelden datums en tijden

1 januari 2022 06:00:00 UTC

1641016800

1 januari 2022 18:00:00 UTC

1641060000

1 https://en.wikipedia.org/wiki/Unix_time
Tijdreeksanalyse in Power BI

Datums bewerken in Power BI

DATEADD()

Verplaatst een opgegeven aantal tijdsintervallen vanaf een referentiedatum.

DATEADD(<dates>,<number_of_intervals>,<interval>)

Voorbeelden:

DATEADD('date', 30, DAY)

var timestamp_PST = 
    DATEADD('timestamp_EST', -3, HOUR)

DATEDIFF()

Berekent het aantal tijdsintervallen tussen twee datumobjecten.

DATEDIFF(<Date1>, <Date2>, <Interval>)

Voorbeelden:

DATEDIFF(DATE(2019,2,1),
        DATE(2020,4,30),
        MONTH)

Result: 14
Tijdreeksanalyse in Power BI

Samenvatten met DAX

Tijdreeksen zijn niet altijd regelmatig en hangen af van hoe data is verzameld. Dit kan lastig zijn:

  • Tijdalgoritmes en formules gaan uit van een vaste interval
  • Belangrijke veranderingen kunnen tussen meetpunten optreden

Gebruik SUMMARIZE() om je tabel te “vervlakken”. Door te aggregeren zie je trends, ook bij ontbrekende of onregelmatige data.

Voorbeeld:

SUMMARIZE('<table>', 
    [group_column(s)], 
    [new aggregated column(s)])

SUMMARIZE('sales', 
    sales[Quarter], 
    sales[Region], 
    "Total Sales", SUM(sales[revenue]))
Tijdreeksanalyse in Power BI

Omgaan met missende data

Imputatie – handig als we veel context hebben over de ontbrekende waarde; dit gebeurt vaak in Power Query.

Voorbeeld imputeren

Data verwijderen – kan als een rij of kolom veel mist; vermijd dit tenzij het de analyse duidelijk verbetert

Voorbeeld data verwijderen

Tijdreeksanalyse in Power BI

Superstore-dataset

In de volgende oefeningen gebruik je de dataset Superstore. Deze bevat Point of Sale (PoS)-data voor Superstore-locaties in de VS. Je gaat datums correct formatteren voor verdere analyse.

Superstore-data

Tijdreeksanalyse in Power BI

Laten we oefenen!

Tijdreeksanalyse in Power BI

Preparing Video For Download...