Basi della trasformazione di serie temporali

Analisi delle serie temporali in Power BI

Kevin Barlow

Data Analytics Professional

Contesto e importanza

  • Le serie temporali sono sempre più diffuse in ogni settore.
  • I sistemi usano requisiti e formati diversi.

 

Architettura dati di esempio

Analisi delle serie temporali in Power BI

ISO come standard internazionale

ISO 8601

  • Standard internazionale per gestire dati di data e ora
  • Consente di tradurre date e orari in formati diversi
  • Supporta localizzazione e personalizzazione
  • Modifica il campo data con FORMAT()

Data di esempio:

var date = January 1st 2022 
# US Standard (MM DD YYYY)

var date2 = FORMAT(date, "DD MM YYYY")
# UK Standard
# 1 January 2022

var date3 = FORMAT(date, "YYYY MM DD")
# ISO Standard
# 2022 January 01
1 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations
Analisi delle serie temporali in Power BI

UNIX per timestamp ad alta precisione

Tempo UNIX

  • Chiamato anche Epoch time
  • Indica i secondi trascorsi dall’Epoch (1 gennaio 1970, 00:00:00 UTC)
  • Tipico dei sistemi informatici
  • Rappresenta un timestamp (data e ora)

Esempi di date e orari

1 gennaio 2022 06:00:00 UTC

1641016800

1 gennaio 2022 18:00:00 UTC

1641060000

1 https://en.wikipedia.org/wiki/Unix_time
Analisi delle serie temporali in Power BI

Manipolare le date in Power BI

DATEADD()

Permette di spostarti di un certo numero di intervalli temporali da una data di riferimento.

DATEADD(<dates>,<number_of_intervals>,<interval>)

Esempi:

DATEADD('date', 30, DAY)

var timestamp_PST = 
    DATEADD('timestamp_EST', -3, HOUR)

DATEDIFF()

Calcola il numero di intervalli temporali tra due date.

DATEDIFF(<Date1>, <Date2>, <Interval>)

Esempi:

DATEDIFF(DATE(2019,2,1),
        DATE(2020,4,30),
        MONTH)

Result: 14
Analisi delle serie temporali in Power BI

Riepilogare i dati con DAX

Le serie temporali non hanno sempre intervalli regolari e dipendono da come sono raccolti i dati. Questo può creare problemi:

  • Algoritmi e formule sul tempo assumono intervalli costanti
  • Possono avvenire cambiamenti rilevanti tra due punti dati

Usa SUMMARIZE() per “smussare” il dataset. Aggregando i dati, otteniamo comunque trend utili anche se mancano dati o sono irregolari.

Esempio:

SUMMARIZE('<table>', 
    [group_column(s)], 
    [new aggregated column(s)])

SUMMARIZE('sales', 
    sales[Quarter], 
    sales[Region], 
    "Total Sales", SUM(sales[revenue]))
Analisi delle serie temporali in Power BI

Gestire i dati mancanti

Imputazione - strategia utile quando sappiamo bene quale dovrebbe essere il valore mancante; spesso fatta in Power Query.

Esempio di imputazione dati

Eliminazione dei dati - utile quando una riga o colonna ha molti valori mancanti; da evitare salvo forte beneficio per l’analisi

Esempio di eliminazione dati

Analisi delle serie temporali in Power BI

Dataset Superstore

Nei prossimi esercizi userai il dataset Superstore. Rappresenta dati di cassa (PoS) dei punti vendita Superstore negli Stati Uniti. Lo userai per formattare le date nel formato corretto per l’analisi.

Dati Superstore

Analisi delle serie temporali in Power BI

¡Vamos a practicar!

Analisi delle serie temporali in Power BI

Preparing Video For Download...