Neden sağkalım analizi kullanılır?

Python ile Survival Analysis

Shae Wang

Senior Data Scientist

Ortalama pil ömrü örneği

DataFrame adı: battery_df

Pil ID Süre Ölü Marka Kamyon
1 2.5 yıl Hayır Marka A Uzun
2 6 yıl Evet Marka B Kısa
3 5 yıl Hayır Marka B Uzun
... ... ... ... ...
1000 4.5 yıl Evet Marka A Kısa

Ortalama pil ömrü nedir?

np.average(battery_df["Duration"])
Python ile Survival Analysis

Ortalama pil ömrü örneği

Pil ömrü sansürü karikatürü.

Python ile Survival Analysis

Pil ömründe sansür

Pil ömrü sansürü karikatürü.

  • Ölmeyen piller için $T_{duration} \neq T_{lifetime}$.
  • 1, 3, 4 numaralı ve arızası gözlenmeyen diğer piller ortalama hesaba uygunsuz biçimde katılır.
Python ile Survival Analysis

Sansür sorunu

Sağkalım süresi yalnızca kısmen bilindiğinde.

Sansür nasıl oluşur?

  • Gözlemin sonunda olay henüz gerçekleşmemiştir.
    • ör. bir deneme kullanıcısı deney sonunda ücretliye dönmemiştir.
  • Kişinin verisi çıkış veya irtibat kaybı nedeniyle eksiktir.
    • ör. bir deneme kullanıcısı deney için veri paylaşmayı reddeder.
Python ile Survival Analysis

Sansür türleri

Sansür türü karikatürü.

  • Sansürsüz: olay gerçekleşti ve sağkalım süresi biliniyor.
  • Sağ sansürlü: sağkalım süresi gözlenen süreden büyüktür.
  • Sol sansürlü: sağkalım süresi gözlenen süreden küçüktür.
  • Aralık sansürlü: sağkalım süresi belirli bir aralıkta, tam değeri bilinmiyor.
Python ile Survival Analysis

Sansür neden sorunludur?

Toplulaştırılmış istatistikler

  • Bir tür eksik veri.
  • np.average(), max(), min() gibi istatistikleri saptırır.

Regresyon

  • Doğrusal regresyon, kare hatalar toplamını en aza indirir.
  • Sansürlü veride hata terimlerini bilmiyoruz.
Python ile Survival Analysis

Sağkalım fonksiyonu

  • Sansürlü veriyi imput etmez.
  • Bir sürenin belirli bir değerden büyük olma olasılığını modeller.

  $$S(t)=Pr(T>t)$$

Python ile Survival Analysis

Sağkalım analizi ve sansür

Sansürsüz veri karikatürü.

Sansürlü veri karikatürü.

Python ile Survival Analysis

Veride sansürü kontrol etme

Sansürlü gözlemleri belirlemenin bir yolu var mı?

Adım 1) Sansür sütunlarını kontrol edin (genellikle önceden hazırlanır).

Çok fazla veri sansürlü mü?

Adım 2) Sansürlü gözlemlerin oranını kontrol edin (kabaca %50 kuralı).

Sansür bilgilendirici değil ve rastgele mi?

Adım 3) Sansür nedenlerini inceleyin; sansürlenmiş olmanın sağkalımı etkilemediğinden emin olun.

Python ile Survival Analysis

Hadi pratik yapalım!

Python ile Survival Analysis

Preparing Video For Download...