Modello di Weibull con covariate

Analisi di sopravvivenza in Python

Shae Wang

Senior Data Scientist

Confrontare funzioni di sopravvivenza

Confronta gruppi con lo stimatore di Kaplan-Meier:

Curve di sopravvivenza Kaplan-Meier: appartamento vs casa.

Confronta gruppi con il test log-rank:

<lifelines.StatisticalResult: logrank_test>
 null_distribution = chi squared
degrees_of_freedom = 1
         test_name = logrank_test
 test_statistic    p  -log2(p)
           0.09 0.77      0.38

   

Q: Come valutare se/come una o più variabili continue influenzano la funzione di sopravvivenza?

Analisi di sopravvivenza in Python

Regressione di sopravvivenza

  • Un metodo che modella le funzioni di sopravvivenza con covariate
  • Quantifica l’effetto di ogni covariata sulla funzione di sopravvivenza

$$Y_i=f(X_i,\beta)$$

$$Y_i: \text{durate}, X_i: \text{covariate}$$

  • Esempi di covariate: età, peso, paese
Analisi di sopravvivenza in Python

Modello AFT (Accelerated Failure Time)

$$\text{Popolazione A}: S_A(t)$$

$$\text{Popolazione B}: S_B(t)$$

$$S_A(t)=S_B(t*\lambda)$$

  • $S_B(t)$ accelera o rallenta rispetto a $S_A(t)$ di un fattore $\lambda$.

  • L’AFT modella questa relazione di accelerazione/decelerazione in base alle covariate.

  • Quando una covariata passa da $a$ a $b$, il tempo all’evento accelera o rallenta del tasso $\lambda$.
  • Esempio: $S_{dog}(t)=S_{human}(t*7)$
Analisi di sopravvivenza in Python

Dati per la regressione di sopravvivenza

Esempio di DataFrame: mortgage_df

id property_type principal interest property_tax credit_score duration paid_off
1 house 1275 0.035 0.019 780 25 0
2 apartment 756 0.028 0.020 695 17 1
3 apartment 968 0.029 0.017 810 5 0
... ... ... ... ... ... ... ...
1000 house 1505 0.041 0.023 750 30 1
Analisi di sopravvivenza in Python

Unire Weibull e AFT: il modello Weibull AFT

  • DataFrame: mortgage_df
  • Covariate:
    • property_type viene sostituita con una variabile dummy:
      • house: 1 se "house", 0 se "apartment"
    • principal
    • interest
    • property_tax
    • credit_score
  1. Importa e istanzia la classe WeibullAFTFitter
    from lifelines import WeibullAFTFitter
    aft = WeibullAFTFitter()
    
  2. Chiama .fit() per adattare il modello ai dati
    aft.fit(df=mortgage_df,
         duration_col="duration",
         event_col="paid_off")
    
Analisi di sopravvivenza in Python

Interpretare l’output del modello

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                      coef  exp(coef)  se(coef)      z       p
lambda_ house         0.04       1.04      0.01   0.99    0.32  
        principal    -0.03       0.97      0.22  -1.04    0.30  
        interest      0.11       1.11      0.15   1.96    0.05  
        property_tax  0.31       1.36      0.27   1.15    0.25  
        credit_score -0.16       0.85      0.14  -2.33    0.02  
        Intercept     3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept     0.34       1.40      0.08   3.80 <0.0005
Analisi di sopravvivenza in Python

WeibullAFTFitter con formula personalizzata

Usa formula per gestire covariate personalizzate:

aft.fit(df=mortgage_df,
        duration_col="duration",
        event_col="paid_off",
        formula="principal + interest * house")

Analogo al modello lineare con interazione:

$\beta_1$principal$+\beta_2$interest$+\beta_3$house$+\beta_4$interest$\cdot$house

Analisi di sopravvivenza in Python

Interpretare l’output del modello

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                       coef  exp(coef)  se(coef)      z       p
lambda_ principal     -0.03       0.97      0.22  -1.04    0.30     
        interest       0.11       1.11      0.15   1.96    0.05  
        house          0.04       1.04      0.01   0.99    0.32  
        interest:house 0.06       1.06      0.14   0.42    0.64
        Intercept      3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept      0.34       1.40      0.08   3.80 <0.0005
Analisi di sopravvivenza in Python

Vamos praticar!

Analisi di sopravvivenza in Python

Preparing Video For Download...