Python ile Survival Analysis
Shae Wang
Senior Data Scientist
DataFrame adı: mortgage_df
| id | property type | duration | paid_off |
|---|---|---|---|
| 1 | house | 25 | 0 |
| 2 | apartment | 17 | 1 |
| 3 | apartment | 5 | 0 |
| ... | ... | ... | ... |
| 100 | house | 30 | 1 |
Property type: ipotekle finanse edilen konut türü (house veya apartment)
Sıklıkla, farklı denek grupları arasında sağkalım (veya olay/sağkalım olasılıkları) farklı mı diye inceleriz.
Her grup için bir Kaplan-Meier sağkalım fonksiyonu uydurun ve eğrileri yan yana görselleştirin.
Yararları:
DataFrame adı: mortgage_df
| id | property type | duration | paid_off |
|---|---|---|---|
| 1 | house | 25 | 0 |
| 2 | apartment | 17 | 1 |
| 3 | apartment | 5 | 0 |
| ... | ... | ... | ... |
| 100 | house | 30 | 1 |
Her grup için Boole maskesi oluşturun.
house = (mortgage_df["property_type"]=="house")
apt = (mortgage_df["property_type"]=="apartment")
Yalnızca 2 grup varsa, 1 maske yeterlidir. Diğeri olumsuzlama ile belirtilebilir.
Tek bir şekil oluşturun ve KaplanMeierFitter sınıfını başlatın.
ax = plt.subplot(111)
mortgage_kmf = KaplanMeierFitter()
mortgage_kmf'yi house grubuna uydurun ve ax üzerinde çizin.
mortgage_kmf.fit(duration=mortgage_df[house]["duration"],
event_observed=mortgage_df[house]["paid_off"],
label="Houses")
mortgage_kmf.plot_survival_function(ax=ax)
mortgage_kmf'yi apartment grubuna uydurun ve ax üzerinde çizin.
mortgage_kmf.fit(duration=mortgage_df[apt]["duration"],
event_observed=mortgage_df[apt]["paid_off"],
label="Apartments")
mortgage_kmf.plot_survival_function(ax=ax)
plt.show()


Not: Güven aralıkları bazı noktalarda örtüşürse, eğriler arasında gerçek bir fark olma olasılığı daha düşüktür.
Python ile Survival Analysis