Güven aralıkları

Python'da Örnekleme

James Chapman

Curriculum Manager, DataCamp

Güven aralıkları

  • "Ortalamanın bir standart sapması içindeki değerler" bu dağılımların her birinden çok sayıda değeri kapsar
  • Buna ilişkin bir kavram olan bir güven aralığı tanımlayacağız
Python'da Örnekleme

Hava tahmini yapmak

  • Amerika Birleşik Devletleri’nde Güney Dakota, Rapid City’nin havası en az öngörülebilirdir
  • İşimiz, yarın oradaki en yüksek sıcaklığı tahmin etmektir

Renklerle bölgelerin ne kadar öngörülebilir olduğunu gösteren bir hava durumu haritası.

Python'da Örnekleme

Hava tahminimiz

  • Nokta tahmini = 47°F (8,3°C)
  • Olası en yüksek sıcaklık aralığı = 40–54°F (4,4–12,8°C)
Python'da Örnekleme

Az önce bir güven aralığı bildirdik!

  • 40–54°F bir güven aralığıdır
  • Bazen 47°F (40°F, 54°F) veya 47°F [40°F, 54°F] olarak yazılır
  • ... ya da 47 ± 7°F
  • 7°F, hata payıdır
Python'da Örnekleme

Ortalama tat için bootstrap dağılımı

import matplotlib.pyplot as plt
plt.hist(coffee_boot_distn, bins=15)
plt.show()

Ortalama kahve tadının histogramı.

Python'da Örnekleme

Yeniden örneklerin ortalaması

import numpy as np
np.mean(coffee_boot_distn)
7.513452892

Dikey siyah çubukla ortalaması gösterilen ortalama kahve tadı histogramı.

Python'da Örnekleme

Ortalama ± bir standart sapma

np.mean(coffee_boot_distn)
7.513452892
np.mean(coffee_boot_distn) - np.std(coffee_boot_distn, ddof=1)
7.497385709174466
np.mean(coffee_boot_distn) + np.std(coffee_boot_distn, ddof=1)
7.529520074825534

Ortalama ve standart sapmalar dikey çubuklarla gösterilen kahve tadı ortalamaları histogramı.

Python'da Örnekleme

Güven aralıkları için çeyrek değer yöntemi

np.quantile(coffee_boot_distn, 0.025)
7.4817195
np.quantile(coffee_boot_distn, 0.975)
7.5448805

Yüzde 95 güven aralığı çizgisi.

Python'da Örnekleme

Ters kümülatif dağılım fonksiyonu

  • PDF: Çan eğrisi
  • CDF: alanı bulmak için çan eğrisini tümleştirir
  • Ters CDF: x ve y eksenlerini çevirir

Python’da uygulanır:

from scipy.stats import norm
norm.ppf(quantile, loc=0, scale=1)

Ters kümülatif dağılım fonksiyonu.

Python'da Örnekleme

Standart hata yöntemiyle güven aralığı

point_estimate = np.mean(coffee_boot_distn)
7.513452892
std_error = np.std(coffee_boot_distn, ddof=1)
0.016067182825533724
from scipy.stats import norm
lower = norm.ppf(0.025, loc=point_estimate, scale=std_error)
upper = norm.ppf(0.975, loc=point_estimate, scale=std_error)
print((lower, upper))
(7.481961792328933, 7.544943991671067)
Python'da Örnekleme

Ayo berlatih!

Python'da Örnekleme

Preparing Video For Download...