Cuantificar el ajuste del modelo

Introducción a la regresión con statsmodels en Python

Maarten Van den Broeck

Content Developer at DataCamp

Modelos de brémenes y percas

Brémenes El diagrama de dispersión de masas de brémenes frente a sus longitudes, con una línea de tendencia, mostrado antes.

Perca El diagrama de dispersión de masas de percas frente a sus longitudes, con una línea de tendencia, mostrado antes.

Introducción a la regresión con statsmodels en Python

Coeficiente de determinación

A veces llamado “r-cuadrado” o “R-cuadrado”.

Proporción de la varianza de la respuesta explicada por la variable explicativa

  • 1 indica ajuste perfecto
  • 0 indica el peor ajuste
Introducción a la regresión con statsmodels en Python

.summary()

Mira el valor “R-Squared”

mdl_bream = ols("mass_g ~ length_cm", data=bream).fit()
print(mdl_bream.summary())
# Some lines of output omitted                          

                            OLS Regression Results                         
Dep. Variable:                 mass_g   R-squared:                       0.878
Model:                            OLS   Adj. R-squared:                  0.874
Method:                 Least Squares   F-statistic:                     237.6
Introducción a la regresión con statsmodels en Python

Atributo .rsquared

print(mdl_bream.rsquared)
0.8780627095147174
Introducción a la regresión con statsmodels en Python

Es la correlación al cuadrado

coeff_determination = bream["length_cm"].corr(bream["mass_g"]) ** 2
print(coeff_determination)
0.8780627095147173
Introducción a la regresión con statsmodels en Python

Error estándar residual (RSE)

Residuos del diagrama de dispersión masa vs. longitud de las brémenes, como antes

  • Una diferencia “típica” entre una predicción y la respuesta observada
  • Tiene la misma unidad que la variable respuesta.
  • MSE = RSE²
Introducción a la regresión con statsmodels en Python

Atributo .mse_resid

mse = mdl_bream.mse_resid
print('mse: ', mse)
mse:  5498.555084973521
rse = np.sqrt(mse)
print("rse: ", rse)
rse:  74.15224261594197
Introducción a la regresión con statsmodels en Python

Calcular el RSE: residuos al cuadrado

residuals_sq = mdl_bream.resid ** 2

print("residuals sq: \n", residuals_sq)
residuals sq: 
0      138.957118
1      260.758635
2     5126.992578
3     1318.919660
4      390.974309
    ...
30    2125.047026
31    6576.923291
32     206.259713
33     889.335096
34    7665.302003
Length: 35, dtype: float64
Introducción a la regresión con statsmodels en Python

Calcular el RSE: suma de residuos al cuadrado

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

print("resid sum of sq :",
      resid_sum_of_sq)
resid sum of sq : 181452.31780412616
Introducción a la regresión con statsmodels en Python

Calcular el RSE: grados de libertad

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

print("deg freedom: ", deg_freedom)

Los grados de libertad son el número de observaciones menos el número de coeficientes del modelo.

deg freedom:  33
Introducción a la regresión con statsmodels en Python

Calcular el RSE: raíz del cociente

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

rse = np.sqrt(resid_sum_of_sq/deg_freedom)

print("rse :", rse)
rse : 74.15224261594197
Introducción a la regresión con statsmodels en Python

Interpretar el RSE

mdl_bream tiene un RSE de 74.

La diferencia entre masas predichas y observadas de brémenes suele ser de ~74 g.

Introducción a la regresión con statsmodels en Python

Error cuadrático medio de raíz (RMSE)

residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

deg_freedom = len(bream.index) - 2

rse = np.sqrt(resid_sum_of_sq/deg_freedom)

print("rse :", rse)
rse : 74.15224261594197
residuals_sq = mdl_bream.resid ** 2

resid_sum_of_sq = sum(residuals_sq)

n_obs = len(bream.index)

rmse = np.sqrt(resid_sum_of_sq/n_obs)

print("rmse :", rmse)
rmse : 72.00244396727619
Introducción a la regresión con statsmodels en Python

¡Vamos a practicar!

Introducción a la regresión con statsmodels en Python

Preparing Video For Download...