Statistische inferentie en aselecte steekproeven

Basis van inferentie in Python

Paul Savala

Assistant Professor of Mathematics

Beschrijvende statistiek

  • Steekproefstatistieken vatten de data samen
  • Beschrijvende statistiek vat onze steekproef samen
Datum SP500-slot Dagelijkse verandering
2017-08-07 2480.91 6.14
2017-08-08 2474.92 -5.99
2017-08-09 2474.02 -0.90
2017-08-10 2438.21 -35.81

Gem. dagelijkse verandering: -$9.14

Basis van inferentie in Python

Inferentie

  • Trek iets af over de populatie
  • Beschrijvende statistiek: beschrijf data
  • Inferentie: trek conclusies en neem beslissingen
Datum SP500-slot Dagelijkse verandering
2017-08-07 2480.91 6.14
2017-08-08 2474.92 -5.99
2017-08-09 2474.02 -0.90
2017-08-10 2438.21 -35.81

Gem. dagelijkse schommeling voor willekeurige dagen ≈ $9.14

Basis van inferentie in Python

Proces van statistische inferentie

Een diagram met populatie → steekproef → inferentie → terug naar populatie.

Basis van inferentie in Python

Puntschattingen

  • Gegeven door één waarde
  • Beste schatting van een onbekende populatiestatistiek

Puntschatting: 1158.95 BTC dagelijkse schommeling

De eerste vijf rijen van de Bitcoin-dataset

btc_high = btc_sp_df['High_BTC']
btc_low = btc_sp_df['Low_BTC']

np.mean(btc_high - btc_low)
1158.95
Basis van inferentie in Python

Steekproeven

Puntschattingen hangen af van de steekproef

btc_sp_first100 = btc_sp_df.iloc[:100]

np.mean(btc_sp_first100['High_BTC'] - btc_sp_first100['Low_BTC'])
659.60
initial_row = np.random.choice(btc_sp_df.shape[0]-100)

btc_sp_random_100 = btc_sp_df.iloc[initial_row:initial_row+100]
np.mean(btc_sp_first100['High_BTC'] - btc_sp_first100['Low_BTC'])
943.83
Basis van inferentie in Python

Laten we oefenen!

Basis van inferentie in Python

Preparing Video For Download...