Model Weibull dengan kovariat

Analisis Survival dengan Python

Shae Wang

Senior Data Scientist

Membandingkan fungsi survival

Bandingkan grup dengan estimator Kaplan–Meier:

Kurva survival Kaplan–Meier: apartemen vs rumah.

Bandingkan grup dengan uji log-rank:

<lifelines.StatisticalResult: logrank_test>
 null_distribution = chi squared
degrees_of_freedom = 1
         test_name = logrank_test
 test_statistic    p  -log2(p)
           0.09 0.77      0.38

   

T: Bagaimana menilai apakah/bagaimana satu atau beberapa variabel kontinu memengaruhi fungsi survival?

Analisis Survival dengan Python

Regresi survival

  • Metode yang memodelkan fungsi survival dengan kovariat
  • Mengukur dampak tiap kovariat pada fungsi survival

$$Y_i=f(X_i,\beta)$$

$$Y_i: \text{durations}, X_i: \text{covariates}$$

  • Contoh kovariat: usia, berat, negara
Analisis Survival dengan Python

Model Accelerated Failure Time (AFT)

$$\text{Populasi A}: S_A(t)$$

$$\text{Populasi B}: S_B(t)$$

$$S_A(t)=S_B(t*\lambda)$$

  • $S_B(t)$ dipercepat atau diperlambat sepanjang $S_A(t)$ dengan faktor $\lambda$.

  • AFT memodelkan percepatan/pelambatan ini berdasarkan kovariat.

  • Saat kovariat berubah dari $a$ ke $b$, waktu-ke-kejadian bertambah cepat atau lambat sebesar laju kegagalan terakselerasi $\lambda$.
  • Contoh: $S_{dog}(t)=S_{human}(t*7)$
Analisis Survival dengan Python

Data untuk regresi survival

Contoh DataFrame: mortgage_df

id property_type principal interest property_tax credit_score duration paid_off
1 house 1275 0.035 0.019 780 25 0
2 apartment 756 0.028 0.020 695 17 1
3 apartment 968 0.029 0.017 810 5 0
... ... ... ... ... ... ... ...
1000 house 1505 0.041 0.023 750 30 1
Analisis Survival dengan Python

Menggabungkan Weibull dengan AFT: model Weibull AFT

  • DataFrame: mortgage_df
  • Kovariat:
    • property_type diganti dengan variabel dummy:
      • house: 1 jika "house", 0 jika "apartment"
    • principal
    • interest
    • property_tax
    • credit_score
  1. Impor dan instansiasi kelas WeibullAFTFitter
    from lifelines import WeibullAFTFitter
    aft = WeibullAFTFitter()
    
  2. Panggil .fit() untuk melatih estimator pada data
    aft.fit(df=mortgage_df,
         duration_col="duration",
         event_col="paid_off")
    
Analisis Survival dengan Python

Menafsirkan keluaran model

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                      coef  exp(coef)  se(coef)      z       p
lambda_ house         0.04       1.04      0.01   0.99    0.32  
        principal    -0.03       0.97      0.22  -1.04    0.30  
        interest      0.11       1.11      0.15   1.96    0.05  
        property_tax  0.31       1.36      0.27   1.15    0.25  
        credit_score -0.16       0.85      0.14  -2.33    0.02  
        Intercept     3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept     0.34       1.40      0.08   3.80 <0.0005
Analisis Survival dengan Python

WeibullAFTFitter dengan formula kustom

Gunakan formula untuk kovariat kustom:

aft.fit(df=mortgage_df,
        duration_col="duration",
        event_col="paid_off",
        formula="principal + interest * house")

Analogi dengan model linear berinteraksi:

$\beta_1$principal$+\beta_2$interest$+\beta_3$house$+\beta_4$interest$\cdot$house

Analisis Survival dengan Python

Menafsirkan keluaran model

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                       coef  exp(coef)  se(coef)      z       p
lambda_ principal     -0.03       0.97      0.22  -1.04    0.30     
        interest       0.11       1.11      0.15   1.96    0.05  
        house          0.04       1.04      0.01   0.99    0.32  
        interest:house 0.06       1.06      0.14   0.42    0.64
        Intercept      3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept      0.34       1.40      0.08   3.80 <0.0005
Analisis Survival dengan Python

Ayo berlatih!

Analisis Survival dengan Python

Preparing Video For Download...