Quantificando o ajuste do modelo

Introdução à Regressão com statsmodels em Python

Maarten Van den Broeck

Content Developer at DataCamp

Modelos de bream e perca

Bream O gráfico de dispersão das massas de bream versus seus comprimentos, com uma linha de tendência, que foi mostrado anteriormente.

Perch O gráfico de dispersão das massas de perca versus seus comprimentos, com uma linha de tendência, que foi mostrado anteriormente.

Introdução à Regressão com statsmodels em Python

Coeficiente de determinação

Às vezes chamado de "r-quadrado" ou "R-quadrado".

A proporção da variância na variável de resposta que é previsível a partir da variável explicativa

  • 1 significa um ajuste perfeito
  • 0 significa o pior ajuste possível
Introdução à Regressão com statsmodels em Python

.summary()

Olhe para o valor intitulado "R-Quadrado"

mdl_bream = ols("mass_g ~ length_cm", data=bream).fit()
print(mdl_bream.summary())
# Algumas linhas de saída omitidas                          

                            OLS Regression Results                         
Dep. Variable:                 mass_g   R-squared:                       0.878
Model:                            OLS   Adj. R-squared:                  0.874
Method:                 Least Squares   F-statistic:                     237.6
Introdução à Regressão com statsmodels em Python

Atributo .rsquared

print(mdl_bream.rsquared)
0.8780627095147174
Introdução à Regressão com statsmodels em Python

É só a correlação ao quadrado

coeff_determination = bream["length_cm"].corr(bream["mass_g"]) ** 2
print(coeff_determination)
0.8780627095147173
Introdução à Regressão com statsmodels em Python

Erro padrão residual (RSE)

Resíduos do gráfico de dispersão de massa vs comprimento do bream, como visto antes

  • Uma diferença "típica" entre uma previsão e uma resposta observada
  • Tem a mesma unidade da variável de resposta.
  • MSE = RSE²
Introdução à Regressão com statsmodels em Python

Atributo .mse_resid

mse = mdl_bream.mse_resid
print('mse: ', mse)
mse:  5498.555084973521
rse = np.sqrt(mse)
print("rse: ", rse)
rse:  74.15224261594197
Introdução à Regressão com statsmodels em Python

Calculando RSE: resíduos ao quadrado

residuals_sq = mdl_bream.resid ** 2

print("residuals sq: \n", residuals_sq)
residuals sq: 
0      138.957118
1      260.758635
2     5126.992578
3     1318.919660
4      390.974309
    ...
30    2125.047026
31    6576.923291
32     206.259713
33     889.335096
34    7665.302003
Length: 35, dtype: float64
Introdução à Regressão com statsmodels em Python

Calculando RSE: soma dos resíduos ao quadrado

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

print("resid sum of sq :",
      resid_sum_of_sq)
resid sum of sq : 181452.31780412616
Introdução à Regressão com statsmodels em Python

Calculando RSE: graus de liberdade

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

print("deg freedom: ", deg_freedom)

Graus de liberdade é igual ao número de observações menos o número de coeficientes do modelo.

deg freedom:  33
Introdução à Regressão com statsmodels em Python

Calculando RSE: raiz quadrada da razão

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

rse = np.sqrt(resid_sum_of_sq/deg_freedom)

print("rse :", rse)
rse : 74.15224261594197
Introdução à Regressão com statsmodels em Python

Interpretando o RSE

mdl_bream tem um RSE de 74.

A diferença entre as massas de bream previstas e observadas é tipicamente de cerca de 74g.

Introdução à Regressão com statsmodels em Python

Erro quadrático médio (RMSE)

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

rse = np.sqrt(resid_sum_of_sq/deg_freedom)

print("rse :", rse)
rse : 74.15224261594197
residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

n_obs = len(bream.index)

rmse = np.sqrt(resid_sum_of_sq/n_obs)

print("rmse :", rmse)
rmse : 72.00244396727619
Introdução à Regressão com statsmodels em Python

Vamos praticar!

Introdução à Regressão com statsmodels em Python

Preparing Video For Download...