Bağ değişkenli Weibull modeli

Python ile Survival Analysis

Shae Wang

Senior Data Scientist

Sağkalım fonksiyonlarını karşılaştırma

Grupları Kaplan-Meier tahmin ediciyle karşılaştırın:

Apartman ve ev için Kaplan-Meier sağkalım eğrileri.

Grupları log-rank testiyle karşılaştırın:

<lifelines.StatisticalResult: logrank_test>
 null_distribution = chi squared
degrees_of_freedom = 1
         test_name = logrank_test
 test_statistic    p  -log2(p)
           0.09 0.77      0.38

   

S: Bir veya birden çok sürekli değişkenin sağkalım fonksiyonunu etkileyip etkilemediğini/nasıl etkilediğini nasıl değerlendiririz?

Python ile Survival Analysis

Sağkalım regresyonu

  • Bağ değişkenleriyle sağkalım fonksiyonlarını modelleyen bir yöntem
  • Her bağ değişkeninin sağkalımı nasıl etkilediğini niceler

$$Y_i=f(X_i,\beta)$$

$$Y_i: \text{süreler}, X_i: \text{bağ değişkenleri}$$

  • Örnek bağ değişkenleri: yaş, kilo, ülke
Python ile Survival Analysis

Hızlandırılmış Arıza Zamanı (AFT) modeli

$$\text{A popülasyonu}: S_A(t)$$

$$\text{B popülasyonu}: S_B(t)$$

$$S_A(t)=S_B(t*\lambda)$$

  • $S_B(t)$, $S_A(t)$ üzerinde $\lambda$ katsayısıyla hızlanır ya da yavaşlar.

  • AFT, bu hızlanma/yavaşlama ilişkisini bağ değişkenlerine göre modeller.

  • Bir bağ değişkeni $a$’dan $b$’ye değiştiğinde, olay zamanını hızlandıran/yavaşlatan oran $\lambda$ olur.
  • Örnek: $S_{dog}(t)=S_{human}(t*7)$
Python ile Survival Analysis

Sağkalım regresyonu için veriler

DataFrame örneği: mortgage_df

id property_type principal interest property_tax credit_score duration paid_off
1 house 1275 0.035 0.019 780 25 0
2 apartment 756 0.028 0.020 695 17 1
3 apartment 968 0.029 0.017 810 5 0
... ... ... ... ... ... ... ...
1000 house 1505 0.041 0.023 750 30 1
Python ile Survival Analysis

Weibull ile AFT’yi birleştirme: Weibull AFT modeli

  • DataFrame: mortgage_df
  • Bağ değişkenleri:
    • property_type kukla değişkenle değiştirilir:
      • house: "house" ise 1, "apartment" ise 0
    • principal
    • interest
    • property_tax
    • credit_score
  1. WeibullAFTFitter sınıfını içe aktarın ve başlatın
    from lifelines import WeibullAFTFitter
    aft = WeibullAFTFitter()
    
  2. Tahminleyiciyi veriye uydurmak için .fit() çağırın
    aft.fit(df=mortgage_df,
         duration_col="duration",
         event_col="paid_off")
    
Python ile Survival Analysis

Model çıktısını yorumlama

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                      coef  exp(coef)  se(coef)      z       p
lambda_ house         0.04       1.04      0.01   0.99    0.32  
        principal    -0.03       0.97      0.22  -1.04    0.30  
        interest      0.11       1.11      0.15   1.96    0.05  
        property_tax  0.31       1.36      0.27   1.15    0.25  
        credit_score -0.16       0.85      0.14  -2.33    0.02  
        Intercept     3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept     0.34       1.40      0.08   3.80 <0.0005
Python ile Survival Analysis

Özel formüllü WeibullAFTFitter

Özel bağ değişkenleri için formula kullanımı:

aft.fit(df=mortgage_df,
        duration_col="duration",
        event_col="paid_off",
        formula="principal + interest * house")

Etkileşim terimli doğrusal modele benzer:

$\beta_1$principal$+\beta_2$interest$+\beta_3$house$+\beta_4$interest$\cdot$house

Python ile Survival Analysis

Model çıktısını yorumlama

print(aft.summary)
<lifelines.WeibullAFTFitter: fitted with 1808 observations, 340 censored>
                       coef  exp(coef)  se(coef)      z       p
lambda_ principal     -0.03       0.97      0.22  -1.04    0.30     
        interest       0.11       1.11      0.15   1.96    0.05  
        house          0.04       1.04      0.01   0.99    0.32  
        interest:house 0.06       1.06      0.14   0.42    0.64
        Intercept      3.99      54.06      0.41   9.52 <0.0005   
rho_    Intercept      0.34       1.40      0.08   3.80 <0.0005
Python ile Survival Analysis

Ayo berlatih!

Python ile Survival Analysis

Preparing Video For Download...