Inferensi statistik dan pengambilan sampel acak

Dasar-dasar Inferensi di Python

Paul Savala

Assistant Professor of Mathematics

Statistik deskriptif

  • Statistik sampel merangkum data
  • Statistik deskriptif merangkum sampel kita
Date SP500 Close Daily Change
2017-08-07 2480.91 6.14
2017-08-08 2474.92 -5.99
2017-08-09 2474.02 -0.90
2017-08-10 2438.21 -35.81

Rata-rata perubahan harian: -$9.14

Dasar-dasar Inferensi di Python

Inferensi

  • Menyimpulkan sesuatu tentang populasi
  • Statistik deskriptif: Mendeskripsikan data
  • Inferensi: Membuat kesimpulan dan keputusan
Date SP500 Close Daily Change
2017-08-07 2480.91 6.14
2017-08-08 2474.92 -5.99
2017-08-09 2474.02 -0.90
2017-08-10 2438.21 -35.81

Rata-rata ayunan harian untuk hari apa pun ~$9.14

Dasar-dasar Inferensi di Python

Proses inferensi statistik

Diagram yang menunjukkan populasi menuju sampel, menuju inferensi, kembali ke populasi.

Dasar-dasar Inferensi di Python

Estimasi titik

  • Dinyatakan dengan satu nilai
  • "Tebakan terbaik" untuk statistik populasi yang tidak diketahui

Estimasi titik: ayunan harian BTC 1158.95

Lima baris pertama dataset Bitcoin

btc_high = btc_sp_df['High_BTC']
btc_low = btc_sp_df['Low_BTC']

np.mean(btc_high - btc_low)
1158.95
Dasar-dasar Inferensi di Python

Pengambilan sampel

Estimasi titik bergantung pada sampel

btc_sp_first100 = btc_sp_df.iloc[:100]

np.mean(btc_sp_first100['High_BTC'] - btc_sp_first100['Low_BTC'])
659.60
initial_row = np.random.choice(btc_sp_df.shape[0]-100)

btc_sp_random_100 = btc_sp_df.iloc[initial_row:initial_row+100]
np.mean(btc_sp_first100['High_BTC'] - btc_sp_first100['Low_BTC'])
943.83
Dasar-dasar Inferensi di Python

Ayo berlatih!

Dasar-dasar Inferensi di Python

Preparing Video For Download...