Sampling dan bias

Dasar-dasar Inferensi di Python

Paul Savala

Assistant Professor of Mathematics

Bias

  • Sampel bias: Suatu kelompok muncul lebih/kurang sering dalam sampel dibanding populasi

Sekelompok orang dengan warna baju berbeda, tetapi sampel hanya berisi orang berbaju hijau.

Dasar-dasar Inferensi di Python

Sampel bias

all_salaries = [75000, 82000, ...]
friends_salaries = [93000, 87000, 103000, 101000]

np.mean(friends_salaries)
96000
Dasar-dasar Inferensi di Python

Distribusi sampling

sampling_distribution = []

for i in range(100):
random_sample = np.random.choice(salaries, size=10) sample_mean = np.mean(random_sample)
sampling_distribution.append(sample_mean)
plt.hist(sampling_distribution) plt.xlabel('Mean salary') plt.ylabel('Percent of samples') plt.title('Sampling distribution of mean salaries') plt.show()
Dasar-dasar Inferensi di Python

Histogram yang menunjukkan distribusi sampling rata-rata gaji. Kurva lonceng kasar terpusat sekitar delapan puluh dua ribu dolar, dengan minimum sekitar tujuh puluh ribu dan maksimum sekitar sembilan puluh lima ribu.

Dasar-dasar Inferensi di Python

Bergantung pada sampel

  • Sampel memengaruhi taksiran titik
  • Taksiran titik memengaruhi inferensi
  • Sampel memengaruhi perhitungan p-value
Dasar-dasar Inferensi di Python

Tidak bergantung pada sampel

  • Statistik populasi
    • Tidak terpengaruh oleh sampel yang dipilih
  • Kesimpulan dari uji
    • Dengan p-value tertentu, kesimpulan tidak terpengaruh oleh sampel yang dipilih
Dasar-dasar Inferensi di Python

Ayo berlatih!

Dasar-dasar Inferensi di Python

Preparing Video For Download...