Pemodelan dengan tidymodels di R
David Svancer
Data Scientist
Memprediksi hwy dengan cty sebagai prediktor
$$hwy = \beta_{0} + \beta_{1} cty$$
Parameter model
Memprediksi hwy dengan cty sebagai prediktor
$$hwy = \beta_{0} + \beta_{1} cty$$
Parameter model
Parameter taksiran dari data pelatihan
$$\small hwy = 0.77 + 1.35(cty)$$
Formula model di parsnip
Bentuk umum
outcome ~ predictor_1 + predictor_2 + ...
Notasi singkat
outcome ~ .
Memprediksi hwy dengan cty sebagai variabel prediktor
hwy ~ cty
Sintaks terpadu untuk spesifikasi model di R
Tentukan jenis model
Tentukan engine
Tentukan mode
Definisikan spesifikasi model dengan parsnip
linear_reg()
Teruskan lm_model ke fungsi fit()
data untuk pelatihan model
lm_model <- linear_reg() %>%set_engine('lm') %>%set_mode('regression')
lm_fit <- lm_model %>%
fit(hwy ~ cty, data = mpg_training)
Fungsi tidy()
parsnip terlatihterm dan estimate berisi parameter taksiran
tidy(lm_fit)
# A tibble: 2 x 5
term estimate std.error statistic p.value
<chr> <dbl> <dbl> <dbl> <dbl>
1 (Intercept) 0.769 0.528 1.46 1.47e- 1
2 cty 1.35 0.0305 44.2 6.32e-97
Teruskan model parsnip terlatih ke fungsi predict()
new_data menentukan data untuk prediksi nilai baru
Keluaran baku dari predict()
new_data.predhwy_predictions <- lm_fit %>% predict(new_data = mpg_test)hwy_predictions
# A tibble: 57 x 1
.pred
<dbl>
1 25.0
2 27.7
3 25.0
4 25.0
5 22.3
# ... with 47 more rows
Fungsi bind_cols()
Langkah
hwy dan cty dari mpg_testbind_cols() dan tambahkan kolom prediksimpg_test_results <- mpg_test %>% select(hwy, cty) %>%bind_cols(hwy_predictions) mpg_test_results
# A tibble: 57 x 3
hwy cty .pred
<int> <int> <dbl>
1 29 18 25.0
2 31 20 27.7
3 27 18 25.0
4 26 18 25.0
5 25 16 22.3
# ... with 47 more rows
Pemodelan dengan tidymodels di R