Ajustando uma regressão linear

Introdução à Regressão em R

Richie Cotton

Data Evangelist at DataCamp

Retas são definidas por duas coisas

Intercepto

O valor de $y$ quando $x$ é zero.

Inclinação

Quanto $y$ aumenta ao aumentar $x$ em 1.

Equação

$y = intercepto + inclinação * x$

Introdução à Regressão em R

Estimando o intercepto

Dispersão de pagamento total vs. número de sinistros com linha de tendência linear. O pagamento cresce linearmente com os sinistros.

Introdução à Regressão em R

Estimando o intercepto

Dispersão de pagamento total vs. número de sinistros, com o ponto onde a linha cruza o eixo y.

Introdução à Regressão em R

Estimando o intercepto

Dispersão de pagamento total vs. número de sinistros, com o valor quando o número de sinistros é zero.

Introdução à Regressão em R

Estimando a inclinação

Dispersão de pagamento total vs. número de sinistros, com dois pontos na linha de tendência. Um em 150 coroas e 40 sinistros; outro em 400 coroas e 110 sinistros.

Introdução à Regressão em R

Estimando a inclinação

Dispersão de pagamento total vs. número de sinistros, com a diferença de pagamento entre dois pontos. 400 coroas menos 150 coroas = 250 coroas.

Introdução à Regressão em R

Estimando a inclinação

Dispersão de pagamento total vs. número de sinistros, com a diferença no número de sinistros entre dois pontos. 110 sinistros menos 40 sinistros = 70.

Introdução à Regressão em R

Estimando a inclinação

Dispersão de pagamento total vs. número de sinistros, com a razão entre a diferença de pagamento e a diferença no número de sinistros. 2000 dividido por 60 ≈ 33.

Introdução à Regressão em R

Rodando um modelo

lm(total_payment_sek ~ n_claims, data = swedish_motor_insurance)
Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414
Introdução à Regressão em R

Interpretando os coeficientes

Call:
lm(formula = total_payment_sek ~ n_claims, data = swedish_motor_insurance)

Coefficients:
(Intercept)     n_claims  
     19.994        3.414

Equation

$total\_payment\_sek = 19.994 + 3.414 * n\_claims$

Introdução à Regressão em R

Vamos praticar!

Introdução à Regressão em R

Preparing Video For Download...