Sebuah plot menyampaikan seribu kata

Memahami Visualisasi Data

Richie Cotton

Data Evangelist at DataCamp

Yang akan Anda pelajari

  • Bagaimana memilih plot yang tepat?
  • Bagaimana menafsirkan jenis plot umum?
  • Praktik terbaik saat membuat plot?
Memahami Visualisasi Data

Tiga cara mendapatkan wawasan

Menghitung statistik ringkas

mean, median, simpangan baku

Menjalankan model

regresi linear dan logistik

Membuat plot

sebar, batang, histogram

Memahami Visualisasi Data

Datasaurus Dozen

away_x away_y bullseye_x bullseye_y ... x_shape_x x_shape_y
32.33 61.41 51.20 83.34 ... 38.34 92.47
53.42 26.19 58.97 85.50 ... 35.75 94.12
63.92 30.83 51.87 85.83 ... 32.77 88.52
70.29 82.53 48.18 85.05 ... 33.73 88.62
34.12 45.73 41.68 84.02 ... 37.24 83.72
67.67 37.11 37.89 82.57 ... 36.03 82.04
1 Matejka, J., & Fitzmaurice, G. (2017) https://www.autodeskresearch.com/publications/samestats
Memahami Visualisasi Data

Rata-rata x per dataset

dataset mean(x)
away 54.27
bullseye 54.27
circle 54.27
dino 54.26
dots 54.26
h_lines 54.26
high_lines 54.27
dataset mean(x)
slant_down 54.27
slant_up 54.27
star 54.27
v_lines 54.27
wide_lines 54.27
x_shape 54.26
Memahami Visualisasi Data

Rata-rata x dan y per dataset

dataset mean(x) mean(y)
away 54.27 47.83
bullseye 54.27 47.83
circle 54.27 47.84
dino 54.26 47.83
dots 54.26 47.84
h_lines 54.26 47.83
high_lines 54.27 47.84
dataset mean(x) mean(y)
slant_down 54.27 47.84
slant_up 54.27 47.83
star 54.27 47.84
v_lines 54.27 47.84
wide_lines 54.27 47.83
x_shape 54.26 47.84
Memahami Visualisasi Data

Simpangan baku per dataset

dataset std_dev(x) std_dev(y)
away 16.77 26.94
bullseye 16.77 26.94
circle 16.76 26.93
dino 16.77 26.94
dots 16.77 26.93
h_lines 16.77 26.94
high_lines 16.77 26.94
dataset std_dev(x) std_dev(y)
slant_down 16.77 26.94
slant_up 16.77 26.94
star 16.77 26.93
v_lines 16.77 26.94
wide_lines 16.77 26.94
x_shape 16.77 26.93
Memahami Visualisasi Data

Plot sebar 13 dataset di Dinosaurus Dozen. Setiap dataset tampak sangat berbeda.

Memahami Visualisasi Data

Variabel kontinu dan kategorikal

Kontinu: biasanya angka

  • tinggi, suhu, pendapatan
Memahami Visualisasi Data

Variabel kontinu dan kategorikal

Kontinu: biasanya angka

  • tinggi, suhu, pendapatan

Kategorikal: biasanya teks

  • warna mata, negara, industri
Memahami Visualisasi Data

Variabel kontinu dan kategorikal

Kontinu: biasanya angka

  • tinggi, suhu, pendapatan

Kategorikal: biasanya teks

  • warna mata, negara, industri

Bisa keduanya

  • usia itu kontinu, tetapi kelompok usia kategorikal
  • waktu itu kontinu, tetapi bulan dalam setahun kategorikal
Memahami Visualisasi Data

Ayo berlatih!

Memahami Visualisasi Data

Preparing Video For Download...