Test d'ipotesi con bootstrap

Pensiero statistico in Python (Parte 2)

Justin Bois

Lecturer at the California Institute of Technology

Pipeline per il test d'ipotesi

  • Indica chiaramente l'ipotesi nulla
  • Definisci la statistica del test
  • Genera molti set di dati simulati assumendo vera l'ipotesi nulla
  • Calcola la statistica per ogni set simulato
  • Il p-value è la frazione dei set simulati in cui la statistica è almeno estrema quanto quella dei dati reali
Pensiero statistico in Python (Parte 2)

Michelson e Newcomb: pionieri della velocità della luce

ch3-3.008.png

1 Immagine di Michelson: pubblico dominio, Smithsonian 2 Immagine di Newcomb: Biblioteca del Congresso degli Stati Uniti
Pensiero statistico in Python (Parte 2)

Michelson e Newcomb: pionieri della velocità della luce

ch3-3.010.png

1 Immagine di Michelson: pubblico dominio, Smithsonian 2 Immagine di Newcomb: Biblioteca del Congresso degli Stati Uniti
Pensiero statistico in Python (Parte 2)

I dati a disposizione

ch3-3.011.png

1 Dati: Michelson, 1880
Pensiero statistico in Python (Parte 2)

Ipotesi nulla

  • La vera velocità della luce negli esperimenti di Michelson era in realtà il valore riportato da Newcomb
Pensiero statistico in Python (Parte 2)

Traslare i dati di Michelson

newcomb_value = 299860  # km/s
michelson_shifted = michelson_speed_of_light \\
           - np.mean(michelson_speed_of_light) + newcomb_value

ch3-3.019.png

Pensiero statistico in Python (Parte 2)

Calcolo della statistica del test

def diff_from_newcomb(data, newcomb_value=299860):
    return np.mean(data) - newcomb_value
diff_obs = diff_from_newcomb(michelson_speed_of_light)

diff_obs
-7.5999999999767169
Pensiero statistico in Python (Parte 2)

Calcolo del p-value

bs_replicates = draw_bs_reps(michelson_shifted,
                             diff_from_newcomb, 10000)

p_value = np.sum(bs_replicates <= diff_observed) / 10000
p_value
0.16039999999999999
Pensiero statistico in Python (Parte 2)

 

Test a un campione

- Confronta un set di dati con un singolo numero

 

Test a due campioni

- Confronta due set di dati
Pensiero statistico in Python (Parte 2)

Ayo berlatih!

Pensiero statistico in Python (Parte 2)

Preparing Video For Download...