Memasang regresi linear

Pengantar Regresi dengan statsmodels di Python

Maarten Van den Broeck

Content Developer at DataCamp

Garis lurus ditentukan oleh dua hal

Intersep

Nilai $y$ saat $x$ sama dengan nol.

Kemiringan (slope)

Kenaikan nilai $y$ jika Anda menaikkan $x$ satu satuan.

Persamaan

$y = \text{intercept} + \text{slope} * x$

Pengantar Regresi dengan statsmodels di Python

Mengestimasi intersep

Plot sebar pembayaran total vs jumlah klaim dengan garis tren linear. Pembayaran naik linier saat jumlah klaim meningkat.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi intersep

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi titik tempat garis tren memotong sumbu y.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi intersep

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi nilai saat jumlah klaim nol.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi kemiringan (slope)

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi dua titik pada garis tren. Satu titik di 1500 krona dan 40 klaim; titik lain di 3500 krona dan 100 klaim.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi kemiringan (slope)

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi selisih pembayaran antara dua titik. 3500 krona dikurangi 1500 krona sama dengan 2000 krona.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi kemiringan (slope)

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi selisih jumlah klaim antara dua titik. 100 klaim dikurangi 40 klaim sama dengan 60 klaim.

Pengantar Regresi dengan statsmodels di Python

Mengestimasi kemiringan (slope)

Plot sebar pembayaran total vs jumlah klaim, diberi anotasi rasio selisih pembayaran dan selisih jumlah klaim. 2000 dibagi 60 kira-kira 33.

Pengantar Regresi dengan statsmodels di Python

Menjalankan model

from statsmodels.formula.api import ols

mdl_payment_vs_claims = ols("total_payment_sek ~ n_claims", data=swedish_motor_insurance)
mdl_payment_vs_claims = mdl_payment_vs_claims.fit()
print(mdl_payment_vs_claims.params)
Intercept    19.994486
n_claims      3.413824
dtype: float64
Pengantar Regresi dengan statsmodels di Python

Menafsirkan koefisien model

Intercept    19.994486
n_claims      3.413824
dtype: float64

Persamaan

$\text{total\_payment\_sek} = 19.99 + 3.41 * \text{n\_claims}$

Pengantar Regresi dengan statsmodels di Python

Ayo berlatih!

Pengantar Regresi dengan statsmodels di Python

Preparing Video For Download...