Dağılım ölçüleri

İstatistiklere Giriş

George Boorman

Curriculum Manager, DataCamp

Dağılım nedir?

Geniş yayılımlı araç suçu histogramı.png

Dar yayılımlı hırsızlık histogramı.png

İstatistiklere Giriş

Dağılım neden önemlidir?

  • Dağılım, verideki çeşitliliği ölçer

 

  • Tişörtlerin tipik fiyatı $30

    • $10-200 arasında olabilir
    • Birinin $30 olma olasılığı nedir?
  • Tişörtler $20-50 arasında olsaydı

    • $30 bulma olasılığı değişir mi?

Duvara asılı tişört.jpg

1 Görsel kredisi: https://unsplash.com/@uyk
İstatistiklere Giriş

Aralık

 

${range} = maksimum - minimum$

 

${range(Burglaries)} = 5,183 - 1,432$

${range(Burglaries)} = 3,751$

İlçe Konut Hırsızlığı
Tower Hamlets 5,183
Hackney 5,079
Barnet 5,067
... ...
Sutton 1,815
Bexley 1,583
Kingston upon Thames 1,432
İstatistiklere Giriş

Varyans

Ortalamayı gösteren ortadaki kırmızı çizgili nokta grafiği.png

İstatistiklere Giriş

Varyans

Westminster ile ortalama arasındaki mesafeyi gösteren varyans grafiği.png

İstatistiklere Giriş

Varyans

İlçe Toplam Suç Ortalama Uzaklık
Barking and Dagenham 37,939 47,672 -9,733
Barnet 52,421 47,672 4,749
Bexley 29,285 47,672 -18,387
Brent 55,465 47,672 7,793
Bromley 42,982 47,672 -4,690
Camden 54,806 47,672 7,134
... ... ... ...
Toplam 1,525,492 1,525,492 0
İstatistiklere Giriş

Varyans

İlçe Toplam Suç Ortalama Uzaklık Kareli Uzaklık
Barking and Dagenham 37,939 47,672 -9,733 94,731,289
Barnet 52,421 47,672 4,749 22,553,001
Bexley 29,285 47,672 -18,387 338,081,769
Brent 55,465 47,672 7,793 60,730,849
Bromley 42,982 47,672 -4,690 21,996,100
Camden 54,806 47,672 7,134 50,893,956
... ... ... ... ...
Toplam 1,525,492 1,525,492 0 7,509,750,824
İstatistiklere Giriş

Varyans

 

$${variance(total \ crime)} = \frac{7,509,750,824}{32}$$

$${variance(total \ crime)} = \ 234,679,713$$

İstatistiklere Giriş

Standart sapma

${standard \ deviation(total \ crime)} = {\sqrt( variance(total \ crime))}$

${standard \ deviation(total \ crime)} = {\sqrt(234,679,713)}$

${standard \ deviation(total \ crime)} = 15,319.26$

  • Sıfıra yakın standart sapma = veriler ortalama çevresinde toplanır
İstatistiklere Giriş

Histogramda standart sapma

Ortalamanın bir ve iki standart sapma uzağını gösteren araç suçu histogramı.png

İstatistiklere Giriş

Çeyrekler

  • Çeyrekler:
    • veriyi dört eşit parçaya böler

 

Suç 0% 25% 50% 75% 100%
Hırsızlık (konut) 1,432.00 2,681.75 3,416.50 4,392.00 5,183.00
Gasp 363.00 895.75 1,354.50 1,976.50 4,156.00
Hırsızlık 4,090.00 7,739.75 9,624.00 12,059.00 40,278.00
Araç Suçları 2,143.00 4,838.25 6,424.50 7,520.75 11,292.00
İstatistiklere Giriş

Çeyrekler

  • Çeyrekler:
    • veriyi dört eşit parçaya böler

 

Suç 0% 25% 50% 75% 100%
Hırsızlık (konut) 1,432.00 2,681.75 3,416.50 4,392.00 5,183.00
Gasp 363.00 895.75 1,354.50 1,976.50 4,156.00
Hırsızlık 4,090.00 7,739.75 9,624.00 12,059.00 40,278.00
Araç Suçları 2,143.00 4,838.25 6,424.50 7,520.75 11,292.00

 

  • İkinci çeyrek (50%) = medyan
İstatistiklere Giriş

Kutu grafikleri

Londra'daki gasp kutu grafiği: medyan ile birinci ve üçüncü çeyrek vurgulu.png

İstatistiklere Giriş

Çeyrekler arası aralık (IQR)

Londra'da gasp için IQR vurgulu kutu grafiği.png

  • IQR aşırı değerlere daha az duyarlıdır

          IQR = 3. Çeyrek - 1. Çeyrek

                IQR = 1976.50 - 895.75

                       IQR = 1080.75

İstatistiklere Giriş

Haydi pratik yapalım!

İstatistiklere Giriş

Preparing Video For Download...