Quantificare l’adattamento della regressione logistica

Introduzione alla regressione con statsmodels in Python

Maarten Van den Broeck

Content Developer at DataCamp

I quattro esiti

previsto falso previsto vero
reale falso corretto falso positivo
reale vero falso negativo corretto
Introduzione alla regressione con statsmodels in Python

Matrice di confusione: conteggi degli esiti

actual_response = churn["has_churned"]
predicted_response = np.round(mdl_recency.predict())
outcomes = pd.DataFrame({"actual_response": actual_response,
                         "predicted_response": predicted_response})
print(outcomes.value_counts(sort=False))
actual_response  predicted_response
0                0.0                   141
                 1.0                    59
1                0.0                   111
                 1.0                    89
Introduzione alla regressione con statsmodels in Python

Visualizzare la matrice di confusione

conf_matrix = mdl_recency.pred_table()

print(conf_matrix)
[[141.              59.]
 [111.              89.]] 
vero negativo falso positivo
falso negativo vero positivo
from statsmodels.graphics.mosaicplot
import mosaic

mosaic(conf_matrix)

Un grafico a mosaico degli esiti del modello churn vs recency. Ci sono 200 osservazioni sia per veri churn sia per veri non-churn, quindi ogni colonna ha la stessa larghezza.

Introduzione alla regressione con statsmodels in Python

Accuratezza

L’accuratezza è la quota di previsioni corrette.

$$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$

 [[141.,  59.],
  [111.,  89.]]
TN = conf_matrix[0,0]
TP = conf_matrix[1,1]
FN = conf_matrix[1,0]
FP = conf_matrix[0,1]
acc = (TN + TP) / (TN + TP + FN + FP)
print(acc)
0.575
Introduzione alla regressione con statsmodels in Python

Sensibilità

La sensibilità è la quota di veri positivi.

$$ \text{sensitivity} = \frac{TP}{FN + TP} $$

 [[141.,  59.],
  [111.,  89.]]
TN = conf_matrix[0,0]
TP = conf_matrix[1,1]
FN = conf_matrix[1,0]
FP = conf_matrix[0,1]
sens = TP / (FN + TP)
print(sens)
0.445
Introduzione alla regressione con statsmodels in Python

Specificità

La specificità è la quota di veri negativi.

$$ \text{specificity} = \frac{TN}{TN + FP} $$

 [[141.,  59.],
  [111.,  89.]]
TN = conf_matrix[0,0]
TP = conf_matrix[1,1]
FN = conf_matrix[1,0]
FP = conf_matrix[0,1]
spec = TN / (TN + FP)
print(spec)
0.705
Introduzione alla regressione con statsmodels in Python

Passiamo alla pratica !

Introduzione alla regressione con statsmodels in Python

Preparing Video For Download...