Introdução à Regressão com statsmodels em Python
Maarten Van den Broeck
Content Developer at DataCamp
| n_claims | total_payment_sek |
|---|---|
| 108 | 392.5 |
| 19 | 46.2 |
| 13 | 15.7 |
| 124 | 422.2 |
| 40 | 119.4 |
| ... | ... |
import pandas as pd
print(swedish_motor_insurance.mean())
n_claims 22.904762
total_payment_sek 98.187302
dtype: float64
print(swedish_motor_insurance['n_claims'].corr(swedish_motor_insurance['total_payment_sek']))
0.9128782350234068
| n_claims | total_payment_sek |
|---|---|
| 108 | 3925 |
| 19 | 462 |
| 13 | 157 |
| 124 | 4222 |
| 40 | 1194 |
| 200 | ??? |
A variável que você quer prever.
As variáveis que explicam como a variável resposta vai mudar.
import matplotlib.pyplot as plt
import seaborn as sns
sns.scatterplot(x="n_claims",
y="total_payment_sek",
data=swedish_motor_insurance)
plt.show()

sns.regplot(x="n_claims",
y="total_payment_sek",
data=swedish_motor_insurance,
ci=None)

Visualizando e ajustando modelos de regressão linear.
Fazendo previsões a partir de modelos de regressão linear e entendendo os coeficientes do modelo.
Avaliando a qualidade do modelo de regressão linear.
O mesmo, mas com modelos de regressão logística
statsmodelsscikit-learnIntrodução à Regressão com statsmodels em Python