Kurva kelangsungan hidup pertama Anda!

Analisis Survival dengan Python

Shae Wang

Senior Data Scientist

Fungsi kelangsungan hidup

  • $T$: saat kejadian yang diminati terjadi
  • $t$: titik waktu mana pun selama observasi

$$\Large{S(t) = Pr(T>t)}$$

  • $S(t)$: memodelkan probabilitas kejadian terjadi setelah $t$
  • $Pr(T>t)$: probabilitas bertahan
Analisis Survival dengan Python

Kurva kelangsungan hidup

$$\Large{S(t) = Pr(T>t)}$$

Contoh kurva kelangsungan hidup.

Analisis Survival dengan Python

Kurva kelangsungan hidup

$$\Large{S(t) = Pr(T>t)}$$

Contoh kurva kelangsungan hidup.

Analisis Survival dengan Python

Kurva kelangsungan hidup

$$\Large{S(t) = Pr(T>t)}$$

Contoh kurva kelangsungan hidup.

Legenda kurva kelangsungan hidup.

Analisis Survival dengan Python

Menafsirkan kurva kelangsungan hidup

  • Titik$(a,b)$: probabilitas individu bertahan lebih lama dari $a$ adalah $b$

Contoh kurva kelangsungan hidup.

Analisis Survival dengan Python

Menafsirkan kurva kelangsungan hidup

  • Titik$(a,b)$: probabilitas individu bertahan lebih lama dari $a$ adalah $b$
  • Kurva lebih datar: laju kejadian lebih rendah
  • Kurva lebih curam: laju kejadian lebih tinggi

Contoh kurva kelangsungan hidup dengan titik yang ditandai.

Analisis Survival dengan Python

Model nonparametrik vs parametrik

Pemodelan nonparametrik
  • Tidak berasumsi bentuk data
Pemodelan parametrik
  • Membuat asumsi tentang bentuk data
  • Did deskripsikan dengan sejumlah parameter terbatas
    • mis., kurva kelangsungan hidup diasumsikan mengikuti distribusi eksponensial
Analisis Survival dengan Python

Model nonparametrik vs parametrik

Pemodelan nonparametrik
  • Kurva kelangsungan hidup biasanya TIDAK mulus

Contoh kurva kelangsungan hidup nonparametrik.

Pemodelan parametrik
  • Kurva kelangsungan hidup biasanya mulus

Contoh kurva kelangsungan hidup parametrik.

  • Bergantung pada apakah model parametrik memang menggambarkan data dengan baik
Analisis Survival dengan Python

Menggambar kurva kelangsungan hidup

Pustaka lifelines adalah paket lengkap untuk analisis kelangsungan hidup.

  • Memasang fungsi kelangsungan hidup ke data
  • Memetakan kurva kelangsungan hidup dari fungsi yang terpasang
import lifelines
import matplotlib.pyplot as plt

.fit(durations, event_observed)

.plot_survival_function()

Analisis Survival dengan Python

Contoh kurva kelangsungan hidup

Nama DataFrame: mortgage_df

id duration paid_off
1 25 0
2 17 1
3 5 0
... ... ...
100 30 1
  • id: id pinjaman hipotek
  • duration: jumlah tahun hipotek belum lunas
  • paid_off: 1 jika hipotek lunas, 0 jika belum lunas
Analisis Survival dengan Python

Contoh kurva kelangsungan hidup

import lifelines
from matplotlib import pyplot as plt
kmf = lifelines.KaplanMeierFitter()
kmf.fit(duration=mortgage_df["duration"], 
        event_observed=mortgage_df["paid_off"])
kmf.plot_survival_function()
plt.show()

contoh kurva kelangsungan hidup kaplan meier

Analisis Survival dengan Python

Ayo berlatih!

Analisis Survival dengan Python

Preparing Video For Download...