Merkezi limit teoremi

Python ile İstatistiğe Giriş

Maggie Matsui

Content Developer, DataCamp

Zarı 5 kez atma

die = pd.Series([1, 2, 3, 4, 5, 6])

# 5 kez at samp_5 = die.sample(5, replace=True) print(samp_5)
array([3, 1, 4, 1, 1])
np.mean(samp_5)
2.0

 

altı yüzlü zar

Python ile İstatistiğe Giriş

Zarı 5 kez atma

# 5 kez at ve ortalamayı al
samp_5 = die.sample(5, replace=True)
np.mean(samp_5)
4.4
samp_5 = die.sample(5, replace=True)
np.mean(samp_5)
3.8
Python ile İstatistiğe Giriş

Zarı 5 kez atmayı 10 kez yapma

10 kez tekrarlayın:

  • 5 kez atın
  • Ortalamayı alın
sample_means = []

for i in range(10):
samp_5 = die.sample(5, replace=True) sample_means.append(np.mean(samp_5))
print(sample_means)
[3.8, 4.0, 3.8, 3.6, 3.2, 4.8, 2.6,
3.0, 2.6, 2.0]
Python ile İstatistiğe Giriş

Örnekleme dağılımları

Örnek ortalamasının örnekleme dağılımı

10 örnek ortalamasının histogramı

Python ile İstatistiğe Giriş

100 örnek ortalaması

sample_means = []
for i in range(100):
    sample_means.append(np.mean(die.sample(5, replace=True)))

100 örnek ortalamasının histogramı

Python ile İstatistiğe Giriş

1000 örnek ortalaması

sample_means = []
for i in range(1000):
    sample_means.append(np.mean(die.sample(5, replace=True)))

1000 örnek ortalamasının histogramı

Python ile İstatistiğe Giriş

Merkezi limit teoremi

Bir istatistiğin örnekleme dağılımı, deneme sayısı arttıkça normal dağılıma yaklaşır.

10, 100 ve 1000 örnek ortalamasının histogramları; daha yüksek sayı çan eğrisine daha çok benzer

 

* Örnekler rastgele ve bağımsız olmalıdır

Python ile İstatistiğe Giriş

Standart sapma ve MLT

sample_sds = []
for i in range(1000):
  sample_sds.append(np.std(die.sample(5, replace=True)))

5 zar atışından 1000 örnek standart sapmasının dağılımı

Python ile İstatistiğe Giriş

Oranlar ve MLT

sales_team = pd.Series(["Amir", "Brian", "Claire", "Damian"])

sales_team.sample(10, replace=True)
array(['Claire', 'Damian', 'Brian', 'Damian', 'Damian', 'Amir', 'Amir', 'Amir', 
      'Amir', 'Damian'], dtype=object)
sales_team.sample(10, replace=True)
array(['Brian', 'Amir', 'Brian', 'Claire', 'Brian', 'Damian', 'Claire', 'Brian', 
      'Claire', 'Claire'], dtype=object)
Python ile İstatistiğe Giriş

Oranın örnekleme dağılımı

Örnek oranlarının dağılımı da normale benzer

Python ile İstatistiğe Giriş

Örnekleme dağılımının ortalaması

# Zarın beklenen değerini tahmin et
np.mean(sample_means)
3.48
# "Claire" oranını tahmin et
np.mean(sample_props)
0.26

Ortadan kesikli çizgili örnek ortalamalarının örnekleme dağılımı  

  • Bilinmeyen temel dağılımın özelliklerini tahmin edin
  • Büyük popülasyonların özelliklerini daha kolay tahmin edin
Python ile İstatistiğe Giriş

Hadi pratik yapalım!

Python ile İstatistiğe Giriş

Preparing Video For Download...