Bootstrap a coppie

Pensiero statistico in Python (Parte 2)

Justin Bois

Lecturer at the California Institute of Technology

Inferenza non parametrica

  • Nessuna assunzione sul modello o sulla distribuzione sottostante ai dati
Pensiero statistico in Python (Parte 2)

Risultati elettorali negli swing state USA 2008

ch2-3.004.png

1 Dati recuperati da Data.gov (https://www.data.gov/)
Pensiero statistico in Python (Parte 2)

Bootstrap a coppie per regressione lineare

  • Riesegui il campionamento a coppie
  • Calcola pendenza e intercetta dai dati ricampionati
  • Ogni pendenza e intercetta è una replica bootstrap
  • Calcola gli intervalli di confidenza dai percentili delle repliche
Pensiero statistico in Python (Parte 2)

Generare un campione bootstrap a coppie

np.arange(7)
array([0, 1, 2, 3, 4, 5, 6])
inds = np.arange(len(total_votes))

bs_inds = np.random.choice(inds, len(inds))
bs_total_votes = total_votes[bs_inds] bs_dem_share = dem_share[bs_inds]
Pensiero statistico in Python (Parte 2)

Calcolare una replica bootstrap a coppie

bs_slope, bs_intercept = np.polyfit(bs_total_votes, 
                                    bs_dem_share, 1)

bs_slope, bs_intercept
(3.9053605692223672e-05, 40.387910131803025)
np.polyfit(total_votes, dem_share, 1)  # fit of original
array([  4.03707170e-05,   4.01139120e+01])
Pensiero statistico in Python (Parte 2)

Risultati elettorali negli swing state USA 2008

ch2-3.022.png

1 Dati recuperati da Data.gov (https://www.data.gov/)
Pensiero statistico in Python (Parte 2)

Ayo berlatih!

Pensiero statistico in Python (Parte 2)

Preparing Video For Download...