Survivalanalyse in Python
Shae Wang
Senior Data Scientist
$$\Large{S(t) = Pr(T>t)}$$
$$\Large{S(t) = Pr(T>t)}$$

$$\Large{S(t) = Pr(T>t)}$$

$$\Large{S(t) = Pr(T>t)}$$






Het lifelines-pakket is een complete bibliotheek voor survivalanalyse.
import lifelines
import matplotlib.pyplot as plt
.fit(durations, event_observed)
.plot_survival_function()
DataFrame-naam: mortgage_df
| id | duration | paid_off |
|---|---|---|
| 1 | 25 | 0 |
| 2 | 17 | 1 |
| 3 | 5 | 0 |
| ... | ... | ... |
| 100 | 30 | 1 |
id: het id van een hypotheekleningduration: aantal jaren dat de hypotheek niet is afgelostpaid_off: 1 als de hypotheek volledig is afgelost, 0 als niet volledigimport lifelines
from matplotlib import pyplot as plt
kmf = lifelines.KaplanMeierFitter()
kmf.fit(duration=mortgage_df["duration"],
event_observed=mortgage_df["paid_off"])
kmf.plot_survival_function()
plt.show()

Survivalanalyse in Python