Interval kepercayaan dan pengambilan sampel

Dasar-dasar Inferensi di Python

Paul Savala

Assistant Professor of Mathematics

Apa itu interval kepercayaan?

  • Gunakan sampel untuk membuat rentang nilai
  • Rentang nilai memperkirakan statistik populasi

Contoh:

  • Sampel 100 karyawan
  • Rata-rata gaji $80.000
  • Simpangan baku $10.000

Sebuah interval kepercayaan dengan tujuh puluh delapan ribu empat puluh dolar di kiri, delapan puluh satu ribu sembilan ratus lima puluh sembilan dolar di kanan, dan delapan puluh ribu dolar di tengah.

Dasar-dasar Inferensi di Python

Menghitung interval kepercayaan

from scipy import stats
import numpy as np


ci = stats.norm.interval(loc=80000, # Mean
scale=10000/np.sqrt(100), # Standard error
alpha=0.95) # Confidence level
print(ci)
(78040.04, 81959.96)

Inferensi yang valid memerlukan distribusi sampling normal

Dasar-dasar Inferensi di Python

Teorema Limit Pusat

  • Rata-ratakan banyak sampel independen
  • Distribusi sampling kira-kira normal
population = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
sample_means = []

for i in range(1000):
sample_5 = np.random.choice(population, size=5)
sample_means.append(sample_5.mean())
Dasar-dasar Inferensi di Python
plt.hist(sample_means)

Histogram dengan "rata-rata sampel" pada sumbu x, "kemunculan" pada sumbu y, judul "distribusi sampling", dan histogram mendekati distribusi normal berpusat di lima.

Dasar-dasar Inferensi di Python

Sebuah kota besar dengan campuran gedung pencakar langit dan rumah kecil yang kumuh.

Dasar-dasar Inferensi di Python

Apa yang diberitahukan interval kepercayaan

(dan apa yang tidak diberitahukannya)

  • Statistik populasi ada atau tidak ada dalam interval kepercayaan
  • Sampel berulang -> 95% interval kepercayaan memuat statistik populasi
Dasar-dasar Inferensi di Python

Ayo berlatih!

Dasar-dasar Inferensi di Python

Preparing Video For Download...