Bootstrap

Python'da Çıkarımın Temelleri

Paul Savala

Assistant Professor of Mathematics

Bootstrap

  • Bootstrap = Yeniden koyarak örnekleme
    1. Rastgele bir örnek seç
    2. Not et
    3. Veriye geri koy (yeniden koyma)
    4. Tekrarla
  • Bootstrap örneği = Bootstrap ile üretilen örnek
Python'da Çıkarımın Temelleri

Parametrik olmayan güven aralığı

  • stats.norm.interval için parametrik olmayan karşılık
    • Yeniden koyarak örnekle
    • Test istatistiğini hesapla
    • Kaydet
    • Tekrarla
  • Ampirik bir dağılım oluşturur
Python'da Çıkarımın Temelleri
salaries_df['Years of Employment']
[6, 11, 14, 3, 2, ...]
sample_1 = salaries_df['Years of Employment'].sample(n=10)

print(max(sample_1) - min(sample_1))
7
  • Bu işlemi birçok kez tekrarla
  • Sonuçların orta %95’i = %95 bootstrap güven aralığı
Python'da Çıkarımın Temelleri
# Statistic function
def max_min(x):
    return max(x) - min(x)

# Data as a tuple data = (salaries_df['Years of Employment'], )
bootstrap_ci = stats.bootstrap(data, max_min, vectorized=False, n_resamples=1000)
print(bootstrap_ci)
BootstrapResult(confidence_interval=ConfidenceInterval(low=33.0, high=38.0),
standard_error=1.3843971812870597)
Python'da Çıkarımın Temelleri

Normal güven aralıkları

 

  • Verinin normal dağılması gerekir
  • Yalnızca ortalama ve standart hataya göre hesaplanır
  • Çıkarım yalnızca normal veri için geçerlidir
  • Hesaplaması çok hızlıdır

Bootstrap güven aralıkları

 

  • Her dağıma uygundur
  • Yeniden örnekleme ile doğrudan veriden hesaplanır
  • Çıkarım her veri için geçerlidir
  • Hesaplaması çok daha yavaştır
Python'da Çıkarımın Temelleri

Bootstrap için kullanım durumları

  • Normal olmayan verilerle çalışırken
    • Sıralı veriler
    • Çarpık veriler
  • Normal güven aralıkları kuşkulu değerler verdiğinde
  • İstediğimiz her istatistikle çalışabiliriz
Python'da Çıkarımın Temelleri

Hadi pratik yapalım!

Python'da Çıkarımın Temelleri

Preparing Video For Download...