Siapa Bayes? Apa itu Bayes?

Analisis Data Bayesian dengan Python

Michal Oleszak

Machine Learning Engineer

Siapa Bayes?

Thomas Bayes

1 Public Domain, https://commons.wikimedia.org/w/index.php?curid=14532025
Analisis Data Bayesian dengan Python

Haruskah Anda membawa payung?

Seorang peramal cuaca memprediksi 50% kemungkinan hujan.

Awan gelap tebal dan kilat.

Analisis Data Bayesian dengan Python

Apa itu Bayes?

  • Inferensi Bayesian berarti memperbarui keyakinan saat informasi baru tersedia.
Analisis Data Bayesian dengan Python

Apa itu Bayes?

  • Inferensi Bayesian berarti memperbarui keyakinan saat informasi baru tersedia.

  • Ini cukup berbeda dari pendekatan klasik.

 

 

Pendekatan frekuentis (klasik) Pendekatan Bayesian
probabilitas
parameter
Analisis Data Bayesian dengan Python

Apa itu Bayes?

  • Inferensi Bayesian berarti memperbarui keyakinan saat informasi baru tersedia.

  • Ini cukup berbeda dari pendekatan klasik.

 

 

Pendekatan frekuentis (klasik) Pendekatan Bayesian
probabilitas proporsi keluaran derajat keyakinan
parameter
Analisis Data Bayesian dengan Python

Apa itu Bayes?

  • Inferensi Bayesian berarti memperbarui keyakinan saat informasi baru tersedia.

  • Ini cukup berbeda dari pendekatan klasik.

 

 

Pendekatan frekuentis (klasik) Pendekatan Bayesian
probabilitas proporsi keluaran derajat keyakinan
parameter nilai tetap variabel acak
Analisis Data Bayesian dengan Python

Mengapa memilih Bayes?

  • Menangani ketidakpastian secara alami (karena parameter berdistribusi!).
  • Bisa memasukkan opini pakar/pengetahuan domain ke model (karena probabilitas = derajat keyakinan!).
  • Tidak bergantung pada konstanta tetap seperti p-value.
  • Secara statistik valid meski data sedikit.
  • Sering selaras dengan hasil frekuentis, namun lebih fleksibel untuk model kustom.
Analisis Data Bayesian dengan Python

Distribusi probabilitas

  • Distribusi variabel acak menyatakan nilai apa yang bisa diambil dan dengan probabilitas berapa.
  • Bisa diskret (himpunan nilai terbatas) atau kontinu (tak hingga banyak nilai).
  • Distribusi kontinu dapat divisualisasikan dengan plot densitas.

Kurva lonceng simetris yang memuncak di sekitar nilai sumbu X 165.

Analisis Data Bayesian dengan Python

Distribusi di Python

print(draws)
[146.58686154393, 159.40688614250, ..., ]

 

print(len(draws))
10000
import matplotlib.pyplot as plt
import seaborn as sns
sns.kdeplot(draws, shade=True)
plt.show()

Kurva lonceng simetris yang memuncak di sekitar nilai sumbu X 165.

Analisis Data Bayesian dengan Python

Ayo berlatih!

Analisis Data Bayesian dengan Python

Preparing Video For Download...