Analisis Survival dengan Python
Shae Wang
Senior Data Scientist
Fungsi hazard $h(t)$: peluang kejadian terjadi pada suatu waktu, dengan syarat bertahan hingga waktu itu.
Laju hazard: laju kejadian sesaat.
$$h(t)=-\frac{d}{dt}logS(t)$$
Fungsi hazard $h(t)$ dan fungsi ketahanan hidup $S(t)$ dapat diturunkan satu sama lain.
Asumsi proportional hazards: hazard semua individu bersifat proporsional satu sama lain.
Untuk individu $A$ dan $B$: $$h_A(t)=ch_B(t)$$

Berdasarkan asumsi proportional hazards: $$h(t|x)=b_0(t)exp\bigg(\sum^{n}_{i=1}b_i(x_i-\overline{x_i}\bigg)$$
$b_0(t)$: fungsi hazard dasar tingkat populasi yang berubah seiring waktu.
$exp\bigg(\sum^{n}_{i=1}b_i(x_i-\overline{x_i}\bigg)$: hubungan linear antara kovariat dan log hazard, TIDAK berubah seiring waktu.
CoxPHFitterfrom lifelines import CoxPHFitter
coxph = CoxPHFitter()
.fit() untuk menyesuaikan estimator ke datacoxph.fit(df, duration_col, event_col)
coxph.summary()
coxph.predict()
mortgage_dfhouseprincipal interest property_taxcredit_scoreduration, paid_offfrom lifelines import CoxPHFittercoxph = CoxPHFitter() coxph.fit(df=mortgage_df, duration_col="duration", event_col="paid_off")
Filter DataFrame:
new_df = mortgage_df.loc[:,
mortgage_df.columns!="house"]
coxph.fit(df=new_df,
duration_col="duration",
event_col="paid_off")
Gunakan parameter formula:
coxph.fit(df=mortgage_df,
duration_col="duration",
event_col="paid_off",
formula="principal + interest
+ property_tax + credit_score")
print(coxph.summary)
<lifelines.CoxPHFitter: fitted with 1808 observations, 340 censored>
coef exp(coef) se(coef) z p
covariate house -0.38 0.68 0.19. -1.98 0.05
principal -0.06 0.94 0.02 -2.61 0.01
interest 0.31 1.37 0.31 1.02 0.31
property_tax -0.15 0.86 0.21 -0.71 0.48
credit_score -0.43 0.65 0.38 -1.14. 0.26
interest dari nilai median -> hazard berubah dengan faktor $e^{0.31}=1.37$, yakni naik 37% dibanding baseline hazard.Analisis Survival dengan Python