Een lineaire regressie fitten

Introductie tot regressie in R

Richie Cotton

Data Evangelist at DataCamp

Rechte lijnen worden door twee dingen bepaald

Intercept

De y-waarde bij x = 0.

Helling

Zoveel neemt y toe als x met 1 stijgt.

Vergelijking

$y = intercept + slope * x$

Introductie tot regressie in R

Het intercept schatten

Een spreidingsplot van totale betaling versus aantal claims met een lineaire trendlijn. De betaling stijgt lineair naarmate het aantal claims toeneemt.

Introductie tot regressie in R

Het intercept schatten

De spreidingsplot van totale betaling versus aantal claims, met het punt waar de trendlijn de y-as kruist.

Introductie tot regressie in R

Het intercept schatten

De spreidingsplot van totale betaling versus aantal claims, met de waarde wanneer het aantal claims nul is.

Introductie tot regressie in R

De helling schatten

De spreidingsplot van totale betaling versus aantal claims, met twee punten op de trendlijn. Eén punt bij 150 kronen en 40 claims; een ander bij 400 kronen en 110 claims.

Introductie tot regressie in R

De helling schatten

De spreidingsplot van totale betaling versus aantal claims, met de verschil in betaling tussen twee punten. 400 kronen min 150 kronen is 250 kronen.

Introductie tot regressie in R

De helling schatten

De spreidingsplot van totale betaling versus aantal claims, met het verschil in aantal claims tussen twee punten. 110 claims min 40 claims is 70 claims.

Introductie tot regressie in R

De helling schatten

De spreidingsplot van totale betaling versus aantal claims, met de verhouding van verschil in betaling en verschil in aantal claims. 2000 gedeeld door 60 is ongeveer 33.

Introductie tot regressie in R

Een model draaien

lm(total_payment_sek ~ n_claims, data = swedish_motor_insurance)
Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414
Introductie tot regressie in R

Modelcoëfficiënten interpreteren

Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414

Vergelijking

$total_payment_sek = 19.994 + 3.414 * n_claims$

Introductie tot regressie in R

Laten we oefenen!

Introductie tot regressie in R

Preparing Video For Download...