Regresi logistik berganda

Regresi Tingkat Menengah di R

Richie Cotton

Data Evangelist at DataCamp

Dataset churn bank

has_churned time_since_first_purchase time_since_last_purchase
0 0.3993247 -0.5158691
1 -0.4297957 0.6780654
0 3.7383122 0.4082544
0 0.6032289 -0.6990435
... ... ...
response lama hubungan kebaruan aktivitas
1 https://www.rdocumentation.org/packages/bayesQR/topics/Churn
Regresi Tingkat Menengah di R

glm()

glm(response ~ explanatory, data = dataset, family = binomial)
glm(response ~ explanatory1 + explanatory2, data = dataset, family = binomial)
glm(response ~ explanatory1 * explanatory2, data = dataset, family = binomial)
Regresi Tingkat Menengah di R

Alur prediksi

explanatory_data <- expand_grid(
  explanatory1 = some_values,
  explanatory2 = some_values
)
prediction_data <- explanatory_data %>% 
  mutate(
    has_churned = predict(mdl, explanatory_data, type = "response")
  )
Regresi Tingkat Menengah di R

Empat keluaran

aktual salah aktual benar
prediksi salah benar false negative
prediksi benar false positive benar
1 https://campus.datacamp.com/courses/introduction-to-regression-in-r/simple-logistic-regression?ex=10
Regresi Tingkat Menengah di R

Confusion matrix

actual_response <- dataset$response
predicted_response <- round(fitted(mdl))
outcomes <- table(predicted_response, actual_response)
confusion <- conf_mat(outcomes)
autoplot(confusion)
summary(confusion, event_level = "second")
Regresi Tingkat Menengah di R

Visualisasi

  • Gunakan faceting untuk variabel kategorikal.
  • Untuk 2 variabel penjelas numerik, gunakan warna untuk respons.
  • Beri satu warna untuk respons di bawah 0.5; warna lain untuk di atas 0.5.
scale_color_gradient2(midpoint = 0.5)
Regresi Tingkat Menengah di R

Ayo berlatih!

Regresi Tingkat Menengah di R

Preparing Video For Download...