Ukuran sebaran

Pengantar Statistika

George Boorman

Curriculum Manager, DataCamp

Apa itu sebaran?

histogram kejahatan kendaraan dengan sebaran lebar.png

histogram kejahatan pencurian rumah dengan sebaran sempit.png

Pengantar Statistika

Mengapa sebaran penting?

  • Sebaran mengukur keragaman data

 

  • Kaos biasanya berharga $30

    • Bisa antara $10–200
    • Seberapa mungkin harganya $30?
  • Jika harga kaos antara $20–50

    • Apakah peluang menemukan harga $30 berubah?

kaos tergantung di dinding.jpg

1 Kredit gambar: https://unsplash.com/@uyk
Pengantar Statistika

Rentang

 

${range} = maksimum - minimum$

 

${range(Burglaries)} = 5,183 - 1,432$

${range(Burglaries)} = 3,751$

Borough Pencurian Rumah
Tower Hamlets 5.183
Hackney 5.079
Barnet 5.067
... ...
Sutton 1.815
Bexley 1.583
Kingston upon Thames 1.432
Pengantar Statistika

Varians

Plot titik dengan garis merah di tengah mewakili mean.png

Pengantar Statistika

Varians

plot varians yang menunjukkan jarak Westminster dari mean.png

Pengantar Statistika

Varians

Borough Total Kejahatan Mean Jarak
Barking and Dagenham 37.939 47.672 -9.733
Barnet 52.421 47.672 4.749
Bexley 29.285 47.672 -18.387
Brent 55.465 47.672 7.793
Bromley 42.982 47.672 -4.690
Camden 54.806 47.672 7.134
... ... ... ...
Total 1.525.492 1.525.492 0
Pengantar Statistika

Varians

Borough Total Kejahatan Mean Jarak Jarak Kuadrat
Barking and Dagenham 37.939 47.672 -9.733 94.731.289
Barnet 52.421 47.672 4.749 22.553.001
Bexley 29.285 47.672 -18.387 338.081.769
Brent 55.465 47.672 7.793 60.730.849
Bromley 42.982 47.672 -4.690 21.996.100
Camden 54.806 47.672 7.134 50.893.956
... ... ... ... ...
Total 1.525.492 1.525.492 0 7.509.750.824
Pengantar Statistika

Varians

 

$${variance(total \ crime)} = \frac{7,509,750,824}{32}$$

$${variance(total \ crime)} = \ 234,679,713$$

Pengantar Statistika

Simpangan baku

${standard \ deviation(total \ crime)} = {\sqrt( variance(total \ crime))}$

${standard \ deviation(total \ crime)} = {\sqrt(234,679,713)}$

${standard \ deviation(total \ crime)} = 15,319.26$

  • Simpangan baku mendekati nol = data mengelompok di sekitar mean
Pengantar Statistika

Simpangan baku pada histogram

histogram kejahatan kendaraan dengan satu dan dua simpangan baku dari mean.png

Pengantar Statistika

Kuartil

  • Kuartil:
    • membagi data menjadi empat bagian sama besar

 

Kejahatan 0% 25% 50% 75% 100%
Pencurian Rumah 1.432,00 2.681,75 3.416,50 4.392,00 5.183,00
Perampokan 363,00 895,75 1.354,50 1.976,50 4.156,00
Pencurian 4.090,00 7.739,75 9.624,00 12.059,00 40.278,00
Kejahatan Kendaraan 2.143,00 4.838,25 6.424,50 7.520,75 11.292,00
Pengantar Statistika

Kuartil

  • Kuartil:
    • membagi data menjadi empat bagian sama besar

 

Kejahatan 0% 25% 50% 75% 100%
Pencurian Rumah 1.432,00 2.681,75 3.416,50 4.392,00 5.183,00
Perampokan 363,00 895,75 1.354,50 1.976,50 4.156,00
Pencurian 4.090,00 7.739,75 9.624,00 12.059,00 40.278,00
Kejahatan Kendaraan 2.143,00 4.838,25 6.424,50 7.520,75 11.292,00

 

  • Kuartil kedua (50%) = median
Pengantar Statistika

Box plot

boxplot perampokan di London dengan median plus kuartil pertama dan ketiga disorot.png

Pengantar Statistika

Rentang antarkuartil (IQR)

boxplot perampokan di London dengan rentang antarkuartil disorot.png

  • IQR kurang terpengaruh nilai ekstrem

          IQR = Kuartil 3 - Kuartil 1

                IQR = 1976,50 - 895,75

                       IQR = 1080,75

Pengantar Statistika

Ayo berlatih!

Pengantar Statistika

Preparing Video For Download...