Güven aralıkları ve örnekleme

Python'da Çıkarımın Temelleri

Paul Savala

Assistant Professor of Mathematics

Güven aralığı nedir?

  • Örneklerden bir değer aralığı üretir
  • Bu aralık, anakitle istatistiğini tahmin eder

Örnek:

  • 100 çalışandan örnek
  • Ortalama maaş $80.000
  • Standart sapma $10.000

Solunda yetmiş sekiz bin kırk dolar, sağında seksen bir bin dokuz yüz elli dokuz dolar ve ortasında seksen bin dolar bulunan bir güven aralığı.

Python'da Çıkarımın Temelleri

Güven aralığı hesaplama

from scipy import stats
import numpy as np


ci = stats.norm.interval(loc=80000, # Mean
scale=10000/np.sqrt(100), # Standard error
alpha=0.95) # Confidence level
print(ci)
(78040.04, 81959.96)

Geçerli çıkarım için normal bir örnekleme dağılımı gerekir

Python'da Çıkarımın Temelleri

Merkezi Limit Teoremi

  • Birçok bağımsız örneğin ortalaması alınır
  • Örnekleme dağılımı yaklaşık normaldir
population = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
sample_means = []

for i in range(1000):
sample_5 = np.random.choice(population, size=5)
sample_means.append(sample_5.mean())
Python'da Çıkarımın Temelleri
plt.hist(sample_means)

x ekseninde "örnek ortalaması", y ekseninde "görülme sıklığı", başlığı "örnekleme dağılımı" olan ve beş etrafında merkezlenen normale yakın bir histogram.

Python'da Çıkarımın Temelleri

Gökdelenlerle yıpranmış küçük evlerin karıştığı büyük bir şehir.

Python'da Çıkarımın Temelleri

Güven aralığı bize ne söyler?

(ve bize söylemediği şeyler)

  • Anakitle istatistiği güven aralığının içinde ya da dışında olabilir
  • Tekrarlanan örneklemlerde → güven aralıklarının %95'i anakitle istatistiğini içerir
Python'da Çıkarımın Temelleri

Haydi pratik yapalım!

Python'da Çıkarımın Temelleri

Preparing Video For Download...