Python ile Survival Analysis
Shae Wang
Senior Data Scientist
DataFrame adı: battery_df
| Pil ID | Süre | Ölü | Marka | Kamyon |
|---|---|---|---|---|
| 1 | 2.5 yıl | Hayır | Marka A | Uzun |
| 2 | 6 yıl | Evet | Marka B | Kısa |
| 3 | 5 yıl | Hayır | Marka B | Uzun |
| ... | ... | ... | ... | ... |
| 1000 | 4.5 yıl | Evet | Marka A | Kısa |
Ortalama pil ömrü nedir?
np.average(battery_df["Duration"])


Sağkalım süresi yalnızca kısmen bilindiğinde.
Sansür nasıl oluşur?

Toplulaştırılmış istatistikler
np.average(), max(), min() gibi istatistikleri saptırır.Regresyon
$$S(t)=Pr(T>t)$$


Sansürlü gözlemleri belirlemenin bir yolu var mı?
Adım 1) Sansür sütunlarını kontrol edin (genellikle önceden hazırlanır).
Çok fazla veri sansürlü mü?
Adım 2) Sansürlü gözlemlerin oranını kontrol edin (kabaca %50 kuralı).
Sansür bilgilendirici değil ve rastgele mi?
Adım 3) Sansür nedenlerini inceleyin; sansürlenmiş olmanın sağkalımı etkilemediğinden emin olun.
Python ile Survival Analysis