Pengambilan Sampel dan Perangkuman

Persiapan Data di Alteryx

Deanna Sanchez

Alteryx ACE and Owner, Nova Geographica LLC

Mengambil sampel data itu seperti...

Mengambil sampel seperti dari tabung reaksi kimia.

  • Lapisan cairan teratas
  • Persentase teratas
  • Sampel acak (peluang 1 dalam N)

Gambar tabung reaksi berisi cairan

Persiapan Data di Alteryx

Opsi tool Sample

Opsi untuk sampling data:

  • N baris pertama atau terakhir
  • Lewati N baris pertama
  • 1 dari setiap N baris
  • Peluang 1 dalam N untuk menyertakan tiap baris
  • N% baris pertama
Persiapan Data di Alteryx

Rekaman Top N dan Bottom N

  • Gunakan tool Sort sebelum tool Sample
    • Urutkan menurun
  • Tambahkan tool Sample
    • N rekaman pertama dengan N = 10
  • Contoh: Top 10 Penjualan

Gambar Sample Top 10

Persiapan Data di Alteryx

Lewati N baris pertama

Memberikan semua baris setelah sejumlah rekaman pertama dilewati

  • Memastikan hanya baris berisi data yang tersisa
  • Contoh: Lewati 4 baris pertama untuk melewati header saat data mulai di baris 5

Contoh spreadsheet dengan header dan logo

Persiapan Data di Alteryx

1 dari setiap N baris

Mengambil baris pertama dari setiap N baris dalam dataset

  • Contoh: 1 dari setiap 10 rekaman
    • Berguna untuk ringkasan hitung berjalan
    • Dataset 100 rekaman mengembalikan 10 rekaman
  • Ini bukan proses sampel acak

Contoh jumlah berjalan 1 dari setiap 10 rekaman

Persiapan Data di Alteryx

Peluang 1 dalam N untuk menyertakan tiap baris

Sampel acak dari dataset

  • Contoh: peluang 1 dalam 25 dari 1000 rekaman
    • Sampel acak dari seluruh dataset
  • Setiap menjalankan workflow menghasilkan dataset sampel acak baru
    • ID yang keluar akan berbeda tiap kali dijalankan

Contoh peluang acak 1 dalam N.jpg

Persiapan Data di Alteryx

N% baris pertama

Mengambil persentase N baris pertama

  • Contoh: 25% baris pertama, mis. Top 25% penjualan
  • Untuk 1.000 rekaman, 25% pertama mengembalikan baris 1–250

Contoh N persen baris pertama

Persiapan Data di Alteryx

Pengelompokan dengan sampel

  • Memungkinkan pengambilan sampel per grup
  • Dapat memilih satu atau lebih field
  • Contoh: 10 penjualan teratas per wilayah

Contoh 10 penjualan teratas per wilayah

Persiapan Data di Alteryx

Menggunakan tool Summarize

Tool Summarize memungkinkan Anda mengelompokkan dan meringkas data dengan banyak opsi.

  • Aksi bergantung pada tipe data field
  • Hanya field dengan aksi yang dioutput
  • Field yang sama bisa punya banyak aksi
    • Contoh: Min dan Maks Pendapatan Penjualan

Contoh min dan maks penjualan per wilayah

Persiapan Data di Alteryx

Merangkum data string

Beberapa aksi data string yang tersedia:

  • Group By
  • Count
  • Count Non Null
  • Min/Max
  • Mode
  • First/Last
  • Concatenate

Contoh group by wilayah dan hitung

Persiapan Data di Alteryx

Merangkum data numerik

Beberapa aksi data numerik yang tersedia:

  • Group By dan opsi data string sebelumnya, ditambah:
  • Sum
  • Average, Median, Mode
  • Percentile
  • Standard Deviation
  • Rumus keuangan seperti IRR (Internal Rate of Return) dan NPV (Net Present Value)

Contoh rangkuman data numerik

Persiapan Data di Alteryx

Urutan itu penting

Aksi diterapkan secara hierarkis

  • Terutama berlaku untuk fungsi Group By
  • Contoh:
    • Group by Wilayah
    • Group by Tim Penjualan
    • Group by Salesperson

Contoh group by wilayah dan tim penjualan

Persiapan Data di Alteryx

Jenis file Alteryx

  • Basis data Alteryx .yxdb
    • Format file native yang dioptimalkan untuk berjalan di Alteryx
    • Dapat output data sebagai .yxdb dan input .yxdb ke workflow
  • Workflow Alteryx .yxmd
    • Format workflow Alteryx Designer
  • Workflow terpaket Alteryx .yxzp
    • Workflow Alteryx terkompresi (zipped)
    • Dapat menyertakan dataset input dan output

Jenis file.jpg

Persiapan Data di Alteryx

Ayo berlatih!

Persiapan Data di Alteryx

Preparing Video For Download...