Ajustement d'une régression linéaire

Introduction à la régression dans R

Richie Cotton

Data Evangelist at DataCamp

Les lignes droites sont définies par deux éléments

Ordonnée à l’origine

La valeur $y$ au moment où $x$ est égal à zéro.

Pente

La valeur $y$ augmente d'autant si vous augmentez $x$ d'un point.

Équation

$y = intercept + slope * x$

Introduction à la régression dans R

Estimation de l'ordonnée à l'origine

Un diagramme en nuage de points représentant le paiement total par rapport au nombre de réclamations, avec une courbe de tendance linéaire. Le paiement augmente de manière linéaire à mesure que le nombre de réclamations augmente.

Introduction à la régression dans R

Estimation de l'ordonnée à l'origine

Le diagramme en nuage de points représentant le paiement total par rapport au nombre de réclamations, avec une annotation indiquant le point où la courbe de tendance croise l'axe des y.

Introduction à la régression dans R

Estimation de l'ordonnée à l'origine

Le diagramme en nuage de points représentant le paiement total par rapport au nombre de réclamations, annoté avec la valeur lorsque le nombre de réclamations est égal à zéro.

Introduction à la régression dans R

Évaluation de la pente

Le diagramme en nuage de points représentant le paiement total par rapport au nombre de réclamations, annoté de deux points sur la courbe de tendance. Un point correspond à 150 couronnes et 40 réclamations ; un autre point correspond à 400 couronnes et 110 réclamations.

Introduction à la régression dans R

Évaluation de la pente

![Le diagramme en nuage de points du paiement total par rapport au nombre de réclamations, annoté avec la différence de paiement entre les deux points. 400 couronnes moins 150 couronnes font 250 couronnes. (https://assets.datacamp.com/production/repositories/5759/datasets/85bbaca93d414d5ab90a55b60ddc6530fbfbdf9e/smooth-swedish-motor-insurance-annotate-slope-dy.png = 52)

Introduction à la régression dans R

Évaluation de la pente

Le diagramme en nuage de points représentant le paiement total par rapport au nombre de réclamations, annoté avec la différence entre le nombre de réclamations pour les deux points. 110 réclamations moins 40 réclamations équivaut à 70 réclamations.

Introduction à la régression dans R

Évaluation de la pente

Le diagramme en nuage de points du paiement total par rapport au nombre de réclamations, annoté avec le ratio de la différence et du paiement ainsi que la différence dans le nombre de réclamations. 2 000 divisé par 60 donne environ 33.

Introduction à la régression dans R

Exécution d'un modèle

lm(total_payment_sek ~ n_claims, data = swedish_motor_insurance)
Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414
Introduction à la régression dans R

Interprétation des coefficients du modèle

Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414

Équation

$total\_payment\_sek = 19.994 + 3.414 * n\_claims$

Introduction à la régression dans R

Passons à la pratique !

Introduction à la régression dans R

Preparing Video For Download...