Campionare e riepilogare

Preparazione dei dati in Alteryx

Deanna Sanchez

Alteryx ACE and Owner, Nova Geographica LLC

Campionare i dati è come...

Prelevare un campione da una provetta di laboratorio.

  • Strato superiore del liquido
  • Percentuale superiore del liquido
  • Campione casuale (probabilità 1 su N)

Immagine di provetta con liquido

Preparazione dei dati in Alteryx

Opzioni dello strumento Sample

Opzioni per campionare i dati:

  • Prime o ultime N righe
  • Salta le prime N righe
  • 1 ogni N righe
  • Probabilità 1 su N per includere ogni riga
  • Primo N% di righe
Preparazione dei dati in Alteryx

Record Top N e Bottom N

  • Usa uno strumento Sort prima di Sample
    • Ordina in ordine decrescente
  • Aggiungi uno strumento Sample
    • Prime N righe dove N = 10
  • Esempio: top 10 vendite

Immagine Sample Top 10

Preparazione dei dati in Alteryx

Salta le prime N righe

Fornisce tutte le righe dopo aver saltato il numero iniziale specificato

  • Garantisce che restino solo righe con dati
  • Esempio: Salta prime 4 righe per ignorare intestazioni; i dati iniziano alla riga 5

Foglio di calcolo con intestazione e logo

Preparazione dei dati in Alteryx

1 ogni N righe

Restituisce la prima riga ogni N righe del dataset

  • Esempio: 1 ogni 10 record
    • Utile per una panoramica di un totale progressivo
    • Un dataset con 100 record restituisce 10 record
  • Non è un campionamento casuale

Esempio di totale progressivo 1 ogni 10 record

Preparazione dei dati in Alteryx

Probabilità 1 su N per includere ogni riga

Campione casuale del dataset

  • Esempio: probabilità 1 su 25 su 1000 record
    • Campione casuale dell’intero dataset
  • A ogni esecuzione del workflow genera un nuovo campione casuale
    • Ogni esecuzione produce ID diversi

Esempio di probabilità casuale 1 su N.jpg

Preparazione dei dati in Alteryx

Primo N% di righe

Restituisce la prima percentuale N di righe

  • Esempio: prime 25% righe, come top 25% delle vendite
  • Con 1.000 record, il primo 25% restituisce le righe 1–250

Esempio del primo N percento di righe

Preparazione dei dati in Alteryx

Raggruppare con campioni

  • Consente di campionare per gruppo
  • Puoi selezionare uno o più campi
  • Esempio: top 10 vendite per regione

Esempio top 10 vendite per regione

Preparazione dei dati in Alteryx

Uso dello strumento Summarize

Lo strumento Summarize permette di raggruppare e riepilogare i dati con molte opzioni.

  • Le azioni dipendono dal tipo di dato del campo
  • In output solo i campi con azioni
  • Lo stesso campo può avere più azioni
    • Esempio: vendite min e max

Esempio di vendite min e max per regione

Preparazione dei dati in Alteryx

Riepilogare dati stringa

Alcune azioni su dati stringa:

  • Group By
  • Count
  • Count Non Null
  • Min/Max
  • Mode
  • First/Last
  • Concatenate

Esempio: raggruppa per regione e conta

Preparazione dei dati in Alteryx

Riepilogare dati numerici

Alcune azioni su dati numerici:

  • Group By e opzioni per stringhe precedenti, più:
  • Sum
  • Average, Median, Mode
  • Percentile
  • Standard Deviation
  • Formule finanziarie come IRR (tasso interno di rendimento) e NPV (valore attuale netto)

Esempio di riepilogo dati numerici

Preparazione dei dati in Alteryx

L’ordine conta

Le azioni si applicano in modo gerarchico

  • Vale soprattutto per la funzione Group By
  • Esempio:
    • Group by Regione
    • Group by Team vendite
    • Group by Venditore

Esempio: raggruppa per regione e team vendite

Preparazione dei dati in Alteryx

Tipi di file Alteryx

  • Database Alteryx .yxdb
    • Formato nativo ottimizzato per Alteryx
    • Puoi esportare in .yxdb e usare .yxdb come input nei workflow
  • Workflow Alteryx .yxmd
    • Formato workflow di Alteryx Designer
  • Workflow impacchettato Alteryx .yxzp
    • Workflow Alteryx compresso
    • Può includere dataset di input e output

Tipi di file.jpg

Preparazione dei dati in Alteryx

Passons à la pratique !

Preparazione dei dati in Alteryx

Preparing Video For Download...