Logistische regressie

Basis van kansrekening in Python

Alexander A. Ramírez M.

CEO @ Synergy Vision

Oorspronkelijke data

Uren studeren vs score data

Basis van kansrekening in Python

Nieuwe data

Geslaagd of gezakt testplot

Basis van kansrekening in Python

Waar trek jij de lijn?

Waar trek je de lijn animatieplot

Basis van kansrekening in Python

Oplossing op basis van kans

Kansberekening met model

Basis van kansrekening in Python

De logistische functie

Logistische functie plot

$$ logistic(t) = logistic(slope*x + intercept) $$

Basis van kansrekening in Python

De helling aanpassen

hellingsparameter maakt sigmoidfunctie steiler animatie

Basis van kansrekening in Python

Het intercept aanpassen

Interceptparameter sigmoidfunctie plot

Basis van kansrekening in Python

Van data naar kans

Kansberekening met logistisch model

Basis van kansrekening in Python

Uitkomsten

Uitkomstplot logistisch model

Basis van kansrekening in Python

Misclassificaties

Kansberekening en misclassificaties

Basis van kansrekening in Python

Logistische regressie

# Import LogisticRegression
from sklearn.linear_model import LogisticRegression
# sklearn logistic model
model = LogisticRegression(C=1e9)
model.fit(hours_of_study, outcomes)
# Get parameters
beta1 = model.coef_[0][0]
beta0 = model.intercept_[0]
# Print parameters
print(beta1, beta0)
(1.3406531235010786, -15.05906237996095)
Basis van kansrekening in Python

Uitkomsten voorspellen op basis van studie-uren

hours_of_study_test = [[10]]
outcome = model.predict(hours_of_study_test)
print(outcome)
array([False])
Basis van kansrekening in Python

Kansberekening

$$ $$

# Put value in an array
value = np.asarray(9).reshape(-1,1)
# Calculate the probability for 9 hours of study
print(model.predict_proba(value)[:,1])
array([0.04773474])
Basis van kansrekening in Python

Laten we oefenen!

Basis van kansrekening in Python

Preparing Video For Download...