Survivalanalyse in Python
Shae Wang
Senior Data Scientist
Een methode voor statistische inferentie
Nulhypothese $H_0$: bijv. inwoners van Californië en Nevada hebben hetzelfde gemiddeld inkomen.
Alternatieve hypothese $H_1$: bijv. inwoners van Californië en Nevada hebben een verschillend gemiddeld inkomen.
P-waarde: hoe waarschijnlijk zijn de data als de nulhypothese waar is?

$H_0$: $S_A(t)=S_B(t)$
$H_1$: $S_A(t)\neq S_B(t)$
Meerdere overlevingscurves

from lifelines.statistics import logrank_testlogrank_test(durations_A, durations_B, event_observed_A, event_observed_B)
.print_summary().p_value.test_statisticVerandert het programma wanneer baby's beginnen te praten?
t.head(2)
id duration observed
0 1 12 0
1 4 6 1
c.head(2)
id duration observed
0 0 11 1
1 2 14 0
lrt = logrank_test(
durations_A = t['duration'],
durations_B = c['duration'],
event_observed_A = t['observed'],
event_observed_B = c['observed'])
lrt.print_summary()
<lifelines.StatisticalResult: logrank_test>
null_distribution = chi squared
degrees_of_freedom = 1
test_name = logrank_test
test_statistic p -log2(p)
0.09 0.77 0.38
lifelines moet data rechts-gecensureerd zijn (bv. subject 3)pairwise_logrank_test() of multivariate_logrank_test()
Survivalanalyse in Python