Steekproeven en samenvatten

Data voorbereiden in Alteryx

Deanna Sanchez

Alteryx ACE and Owner, Nova Geographica LLC

Steekproeven lijkt op . . .

Een sample nemen is als in een reageerbuis.

  • Bovenste laag vloeistof
  • Bovenste percentage vloeistof
  • Willekeurige steekproef (1 op N kans)

Afbeelding van reageerbuis met vloeistof

Data voorbereiden in Alteryx

Sample-tool opties

Opties voor steekproeven nemen:

  • Eerste of laatste N rijen
  • Sla de eerste N rijen over
  • 1 van elke N rijen
  • 1 op N kans om elke rij op te nemen
  • Eerste N% rijen
Data voorbereiden in Alteryx

Top N en Bottom N records

  • Gebruik een Sort-tool vóór de Sample-tool
    • Sorteer aflopend
  • Voeg een Sample-tool toe
    • Eerste N records waarbij N = 10
  • Voorbeeld: Top 10 sales

Sample Top 10 afbeelding

Data voorbereiden in Alteryx

Sla de eerste N rijen over

Geeft alle rijen na het overslaan van het opgegeven aantal eerste records

  • Zorgt dat alleen rijen met data overblijven
  • Voorbeeld: Sla de eerste 4 rijen over om kopregels te negeren als data op regel 5 begint

Spreadsheet met header en logo voorbeeld

Data voorbereiden in Alteryx

1 van elke N rijen

Geeft de eerste rij van elke N rijen in de dataset

  • Voorbeeld: 1 van elke 10 records
    • Handig voor een overzicht van een cumulatief totaal
    • Een dataset met 100 records geeft 10 records terug
  • Dit is geen willekeurige steekproef

Cumulatief totaal: 1 van elke 10 records voorbeeld

Data voorbereiden in Alteryx

1 op N kans om elke rij op te nemen

Willekeurige steekproef van de dataset

  • Voorbeeld: 1 op 25 kans uit 1000 records
    • Willekeurige steekproef van de hele dataset
  • Levert bij elke run een nieuw willekeurig sample op
    • Elke run geeft andere ID's

1 op N willekeurige kans voorbeeld.jpg

Data voorbereiden in Alteryx

Eerste N% rijen

Geeft de eerste N procent van de rijen

  • Voorbeeld: Eerste 25% van de rijen, zoals top 25% van de sales
  • Bij 1.000 records geven de eerste 25% rijen 1–250 terug

Eerste N procent rijen voorbeeld

Data voorbereiden in Alteryx

Groeperen met samples

  • Laat per groep steekproeven nemen
  • Je kunt één of meer velden kiezen
  • Voorbeeld: Top 10 sales per regio

Top 10 sales per regio voorbeeld

Data voorbereiden in Alteryx

De Summarize-tool gebruiken

Met Summarize kun je groeperen en samenvatten met veel opties.

  • Acties hangen af van het veldtype
  • Alleen velden met acties worden uitgegeven
  • Hetzelfde veld kan meerdere acties hebben
    • Voorbeeld: Min en Max omzet

Regio min en max sales voorbeeld

Data voorbereiden in Alteryx

Tekstdatavelden samenvatten

Voorbeelden van tekstdata-acties:

  • Group By
  • Count
  • Count Non Null
  • Min/Max
  • Mode
  • First/Last
  • Concatenate

Groepeer op regio en tel voorbeeld

Data voorbereiden in Alteryx

Numerieke datavelden samenvatten

Voorbeelden van numerieke data-acties:

  • Group By en eerdere tekstopties, plus:
  • Sum
  • Average, Median, Mode
  • Percentile
  • Standard Deviation
  • Finanzformules zoals IRR (Internal Rate of Return) en NPV (Net Present Value)

Numerieke data samenvatten voorbeeld

Data voorbereiden in Alteryx

Volgorde is belangrijk

Acties worden hiërarchisch toegepast

  • Geldt vooral voor de Group By-functie
  • Voorbeeld:
    • Groepeer op regio
    • Groepeer op salesteam
    • Groepeer op verkoper

Groepeer op regio en salesteam voorbeeld

Data voorbereiden in Alteryx

Alteryx-bestandstypen

  • Alteryx-database .yxdb
    • Eigen bestandsformaat, geoptimaliseerd voor Alteryx
    • Je kunt als .yxdb wegschrijven en .yxdb in workflows inlezen
  • Alteryx-workflow .yxmd
    • Formaat voor Alteryx Designer-workflows
  • Alteryx verpakte workflow .yxzp
    • Gezipte Alteryx-workflow
    • Kan input- en outputdatasets bevatten

Bestandstypen.jpg

Data voorbereiden in Alteryx

Laten we oefenen!

Data voorbereiden in Alteryx

Preparing Video For Download...