Bir grafik bin kelimeye değer

Veri Görselleştirmeyi Anlama

Richie Cotton

Data Evangelist at DataCamp

Öğrenecekleriniz

  • Uygun grafiği nasıl seçersiniz?
  • Yaygın grafik türlerini nasıl yorumlarsınız?
  • Grafik çizmek için en iyi uygulamalar nelerdir?
Veri Görselleştirmeyi Anlama

İçgörü elde etmenin üç yolu

Özet istatistikleri hesaplama

ortalama, medyan, standart sapma

Modelleri çalıştırma

doğrusal ve lojistik regresyon

Grafikleri çizme

dağılım, çubuk, histogram

Veri Görselleştirmeyi Anlama

Datazor Düzinesi

away_x away_y bullseye_x bullseye_y ... x_shape_x x_shape_y
32,33 61,41 51,20 83,34 ... 38,34 92,47
53,42 26,19 58,97 85,50 ... 35,75 94,12
63,92 30,83 51,87 85,83 ... 32,77 88,52
70,29 82,53 48,18 85,05 ... 33,73 88,62
34,12 45,73 41,68 84,02 ... 37,24 83,72
67,67 37,11 37,89 82,57 ... 36,03 82,04
1 Matejka, J. ve Fitzmaurice, G. (2017) https://www.autodeskresearch.com/publications/samestats
Veri Görselleştirmeyi Anlama

Her veri kümesi için x'in ortalaması

veri kümesi ortalama(x)
away 54,27
bullseye 54,27
circle 54,27
dino 54,26
dots 54,26
h_lines 54,26
high_lines 54,27
veri kümesi ortalama(x)
slant_down 54,27
slant_up 54,27
star 54,27
v_lines 54,27
wide_lines 54,27
x_shape 54,26
Veri Görselleştirmeyi Anlama

Her veri kümesi için x ve y'nin ortalaması

veri kümesi ortalama(x) ortalama(y)
away 54,27 47,83
bullseye 54,27 47,83
circle 54,27 47,84
dino 54,26 47,83
dots 54,26 47,84
h_lines 54,26 47,83
high_lines 54,27 47,84
veri kümesi ortalama(x) ortalama(y)
slant_down 54,27 47,84
slant_up 54,27 47,83
star 54,27 47,84
v_lines 54,27 47,84
wide_lines 54,27 47,83
x_shape 54,26 47,84
Veri Görselleştirmeyi Anlama

Her veri kümesi için standart sapmalar

veri kümesi std_dev(x) std_dev(y)
away 16,77 26,94
bullseye 16,77 26,94
circle 16,76 26,93
dino 16,77 26,94
dots 16,77 26,93
h_lines 16,77 26,94
high_lines 16,77 26,94
veri kümesi std_dev(x) std_dev(y)
slant_down 16,77 26,94
slant_up 16,77 26,94
star 16,77 26,93
v_lines 16,77 26,94
wide_lines 16,77 26,94
x_shape 16,77 26,93
Veri Görselleştirmeyi Anlama

Dinozor Düzinesindeki 13 veri kümesinin dağılım grafikleri. Her veri kümesi diğerlerinden çok farklı görünüyor

Veri Görselleştirmeyi Anlama

Sürekli ve kategorik değişkenler

Sürekli: genellikle sayılar

  • yükseklikler, sıcaklıklar, gelirler
Veri Görselleştirmeyi Anlama

Sürekli ve kategorik değişkenler

Sürekli: genellikle sayılar

  • yükseklikler, sıcaklıklar, gelirler

Kategorik: genellikle metin

  • göz renkleri, ülkeler, endüstri
Veri Görselleştirmeyi Anlama

Sürekli ve kategorik değişkenler

Sürekli: genellikle sayılar

  • yükseklikler, sıcaklıklar, gelirler

Kategorik: genellikle metin

  • göz renkleri, ülkeler, endüstri

Şunlardan biri olabilir:

  • yaş süreklidir ancak yaş grubu kategoriktir
  • zaman süreklidir, yılın ayı kategoriktir
Veri Görselleştirmeyi Anlama

Şimdi alıştırma yapalım!

Veri Görselleştirmeyi Anlama

Preparing Video For Download...