Introduction à la régression avec statsmodels en Python
Maarten Van den Broeck
Content Developer at DataCamp
| n_claims | total_payment_sek |
|---|---|
| 108 | 392,5 |
| 19 | 46,2 |
| 13 | 15,7 |
| 124 | 422,2 |
| 40 | 119,4 |
| ... | ... |
import pandas as pd print(swedish_motor_insurance.mean())n_claims 22.904762 total_payment_sek 98.187302 dtype: float64print(swedish_motor_insurance['n_claims'].corr(swedish_motor_insurance['total_payment_sek']))0.9128782350234068
| n_claims | total_payment_sek |
|---|---|
| 108 | 3925 |
| 19 | 462 |
| 13 | 157 |
| 124 | 4222 |
| 40 | 1194 |
| 200 | ??? |
La variable que vous souhaitez prédire.
Les variables qui expliquent comment la variable de réponse évoluera.
import matplotlib.pyplot as plt
import seaborn as sns
sns.scatterplot(x="n_claims",
y="total_payment_sek",
data=swedish_motor_insurance)
plt.show()

sns.regplot(x="n_claims",
y="total_payment_sek",
data=swedish_motor_insurance,
ci=None)

Visualisation et ajustement de modèles de régression linéaire.
Réalisation de prévisions à partir de modèles de régression linéaire et compréhension des coefficients des modèles.
Évaluation de la qualité du modèle de régression linéaire.
De nouveau, mais avec des modèles de régression logistique
statsmodelsscikit-learnIntroduction à la régression avec statsmodels en Python