Weibull-model met covariaten

Survivalanalyse in Python

Shae Wang

Senior Data Scientist

Overlevingsfuncties vergelijken

Vergelijk groepen met de Kaplan–Meier-schatting:

Kaplan–Meier-overlevingscurves: appartement vs. huis.

Vergelijk groepen met de log-ranktest:

<lifelines.StatisticalResult: logrank_test>
 null_distribution = chi squared
degrees_of_freedom = 1
         test_name = logrank_test
 test_statistic    p  -log2(p)
           0.09 0.77      0.38

   

V: Hoe beoordelen we of/hoe één of meer continue variabelen de overlevingsfunctie beïnvloeden?

Survivalanalyse in Python

Survival-regressie

  • Een methode die overlevingsfuncties met covariaten modelleert
  • Kwantificeert hoe elke covariaat de overlevingsfunctie beïnvloedt

$$Y_i=f(X_i,\beta)$$

$$Y_i: \text{duur}, X_i: \text{covariaten}$$

  • Voorbeelden covariaten: leeftijd, gewicht, land
Survivalanalyse in Python

Het Accelerated Failure Time (AFT)-model

$$\text{Populatie A}: S_A(t)$$

$$\text{Populatie B}: S_B(t)$$

$$S_A(t)=S_B(t*\lambda)$$

  • $S_B(t)$ versnelt of vertraagt langs $S_A(t)$ met factor $\lambda$.

  • AFT modelleert deze versnelling/vertraging op basis van covariaten.

  • Als een covariaat verandert van $a$ naar $b$, versnelt of vertraagt de tijd-tot-event met de versnellingsfactor $\lambda$.
  • Voorbeeld: $S_{dog}(t)=S_{human}(t*7)$
Survivalanalyse in Python

Data voor survival-regressie

DataFrame-voorbeeld: mortgage_df

id property_type principal interest property_tax credit_score duration paid_off
1 house 1275 0.035 0.019 780 25 0
2 apartment 756 0.028 0.020 695 17 1
3 apartment 968 0.029 0.017 810 5 0
... ... ... ... ... ... ... ...
1000 house 1505 0.041 0.023 750 30 1
Survivalanalyse in Python

Weibull combineren met AFT: het Weibull AFT-model

  • DataFrame: mortgage_df
  • Covariaten:
    • property_type wordt vervangen door een dummyvariabele:
      • house: 1 bij "house", 0 bij "apartment"
    • principal
    • interest
    • property_tax
    • credit_score
  1. Importeer en instantieer de klasse WeibullAFTFitter
    from lifelines import WeibullAFTFitter
    aft = WeibullAFTFitter()
    
  2. Roep .fit() aan om de estimator te fitten op de data
    aft.fit(df=mortgage_df,
         duration_col="duration",
         event_col="paid_off")
    
Survivalanalyse in Python

Modeloutput interpreteren

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                      coef  exp(coef)  se(coef)      z       p
lambda_ house         0.04       1.04      0.01   0.99    0.32  
        principal    -0.03       0.97      0.22  -1.04    0.30  
        interest      0.11       1.11      0.15   1.96    0.05  
        property_tax  0.31       1.36      0.27   1.15    0.25  
        credit_score -0.16       0.85      0.14  -2.33    0.02  
        Intercept     3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept     0.34       1.40      0.08   3.80 <0.0005
Survivalanalyse in Python

WeibullAFTFitter met aangepaste formule

formula gebruiken voor aangepaste covariaten:

aft.fit(df=mortgage_df,
        duration_col="duration",
        event_col="paid_off",
        formula="principal + interest * house")

Analoog aan een lineair model met interactie:

$\beta_1$principal$+\beta_2$interest$+\beta_3$house$+\beta_4$interest$\cdot$house

Survivalanalyse in Python

Modeloutput interpreteren

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                       coef  exp(coef)  se(coef)      z       p
lambda_ principal     -0.03       0.97      0.22  -1.04    0.30     
        interest       0.11       1.11      0.15   1.96    0.05  
        house          0.04       1.04      0.01   0.99    0.32  
        interest:house 0.06       1.06      0.14   0.42    0.64
        Intercept      3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept      0.34       1.40      0.08   3.80 <0.0005
Survivalanalyse in Python

Laten we oefenen!

Survivalanalyse in Python

Preparing Video For Download...