Analisi di sopravvivenza in Python
Shae Wang
Senior Data Scientist
Un metodo di inferenza statistica
Ipotesi nulla $H_0$: es. residenti di California e Nevada hanno lo stesso reddito medio.
Ipotesi alternativa $H_1$: es. residenti di California e Nevada hanno redditi medi diversi.
P-value: quanto è probabile osservare i dati se l'ipotesi nulla è vera?

$H_0$: $S_A(t)=S_B(t)$
$H_1$: $S_A(t)\neq S_B(t)$
Curve di sopravvivenza multiple

from lifelines.statistics import logrank_testlogrank_test(durations_A, durations_B, event_observed_A, event_observed_B)
.print_summary().p_value.test_statisticIl programma cambia quando i bambini iniziano a parlare?
t.head(2)
id duration observed
0 1 12 0
1 4 6 1
c.head(2)
id duration observed
0 0 11 1
1 2 14 0
lrt = logrank_test(
durations_A = t['duration'],
durations_B = c['duration'],
event_observed_A = t['observed'],
event_observed_B = c['observed'])
lrt.print_summary()
<lifelines.StatisticalResult: logrank_test>
null_distribution = chi squared
degrees_of_freedom = 1
test_name = logrank_test
test_statistic p -log2(p)
0.09 0.77 0.38
lifelines, i dati devono essere destri-censurati (es. soggetto 3)pairwise_logrank_test() o multivariate_logrank_test()
Analisi di sopravvivenza in Python