Melaporkan hasil Bayesian

Analisis Data Bayesian dengan Python

Michal Oleszak

Machine Learning Engineer

Cara yang jujur

  • Laporkan prior dan posterior setiap parameter
posterior_draws
array([8.02800413, 8.97359548, 7.57437476, ..., 5.85264609, 7.92875104,
       7.41463758])
  • Plot distribusi prior dan posterior
sns.kdeplot(prior_draws, shade=True, label="prior")
sns.kdeplot(posterior_draws, shade=True, label="posterior")
Analisis Data Bayesian dengan Python

Cara yang jujur

Dua plot densitas saling menumpuk. Keduanya berbentuk lonceng. Prior berpusat di 0, pendek dan lebar; posterior berpusat di sekitar 7 dan jauh lebih tinggi serta lebih sempit.

Analisis Data Bayesian dengan Python

Cara yang jujur

Dua plot densitas saling menumpuk. Keduanya berbentuk lonceng. Prior berpusat di 0, pendek dan lebar; posterior berpusat di sekitar 7 dan jauh lebih tinggi serta lebih sempit.

Analisis Data Bayesian dengan Python

Cara yang jujur

Dua plot densitas saling menumpuk. Keduanya berbentuk lonceng. Prior berpusat di 0, pendek dan lebar; posterior berpusat di sekitar 7 dan jauh lebih tinggi serta lebih sempit.

Analisis Data Bayesian dengan Python

Cara yang jujur

Dua plot densitas saling menumpuk. Keduanya berbentuk lonceng. Prior berpusat di 0, pendek dan lebar; posterior berpusat di sekitar 7 dan jauh lebih tinggi serta lebih sempit.

Analisis Data Bayesian dengan Python

Taksiran titik Bayesian

  • Tidak ada satu angka pun yang dapat mewakili semua informasi dalam sebuah distribusi

  • Namun, kadang diperlukan taksiran titik suatu parameter

Plot densitas berbentuk lonceng.

Analisis Data Bayesian dengan Python

Taksiran titik Bayesian

  • Tidak ada satu angka pun yang dapat mewakili semua informasi dalam sebuah distribusi

  • Namun, kadang diperlukan taksiran titik suatu parameter

posterior_mean = np.mean(posterior_draws)


Plot densitas berbentuk lonceng dengan garis vertikal menandai rataan.

Analisis Data Bayesian dengan Python

Taksiran titik Bayesian

  • Tidak ada satu angka pun yang dapat mewakili semua informasi dalam sebuah distribusi

  • Namun, kadang diperlukan taksiran titik suatu parameter

posterior_mean = np.mean(posterior_draws)
posterior_median = np.median(posterior_draws)

Plot densitas berbentuk lonceng dengan garis vertikal menandai median.

Analisis Data Bayesian dengan Python

Taksiran titik Bayesian

  • Tidak ada satu angka pun yang dapat mewakili semua informasi dalam sebuah distribusi

  • Namun, kadang diperlukan taksiran titik suatu parameter

posterior_mean = np.mean(posterior_draws)
posterior_median = np.median(posterior_draws)
posterior_p75 = np.percentile(posterior_draws, 75)

Plot densitas berbentuk lonceng dengan garis vertikal menandai persentil ke-75.

Analisis Data Bayesian dengan Python

Interval kredibel

  • Suatu interval dengan probabilitas parameter berada di dalamnya sebesar x%
  • Semakin lebar interval kredibel, semakin besar ketidakpastian taksiran parameter
  • Parameter bersifat acak, jadi dapat berada dalam interval dengan probabilitas tertentu
  • Dalam pendekatan frequentist, interval (kepercayaan) bersifat acak sedangkan parameter tetap

Plot densitas berbentuk lonceng dengan dua garis vertikal putus-putus menandai area di antaranya.

Analisis Data Bayesian dengan Python

Kerapatan Posterior Tertinggi (HPD)

GIF plot densitas berbentuk lonceng yang menampilkan garis horizontal turun di area plot, menghasilkan peningkatan massa probabilitas di antara titik tempat garis memotong plot.

import arviz as az

hpd = az.hdi(posterior_draws, 
             hdi_prob=0.9)
print(hpd)
[-4.86840193  4.96075498]
Analisis Data Bayesian dengan Python

Ayo berlatih melaporkan hasil Bayesian!

Analisis Data Bayesian dengan Python

Preparing Video For Download...