Modelleren met tidymodels in R
David Svancer
Data Scientist
hwy voorspellen met cty als voorspeller
$$hwy = \beta_{0} + \beta_{1} cty$$
Modelparameters
hwy voorspellen met cty als voorspeller
$$hwy = \beta_{0} + \beta_{1} cty$$
Modelparameters
Geschatte parameters uit trainingsdata
$$\small hwy = 0.77 + 1.35(cty)$$
Modelformules in parsnip
Algemene vorm
outcome ~ predictor_1 + predictor_2 + ...
Verkorting
outcome ~ .
hwy voorspellen met cty als voorspeller
hwy ~ cty
Eenduidige syntax voor modelspecificatie in R
Specificeer het modeltype
Kies de engine
Stel de modus in
Definieer modelspecificatie met parsnip
linear_reg()
Geef lm_model door aan fit()
data voor het fitten
lm_model <- linear_reg() %>%set_engine('lm') %>%set_mode('regression')
lm_fit <- lm_model %>%
fit(hwy ~ cty, data = mpg_training)
De functie tidy()
parsnip-modelobjectterm en estimate geven de geschatte parameters
tidy(lm_fit)
# A tibble: 2 x 5
term estimate std.error statistic p.value
<chr> <dbl> <dbl> <dbl> <dbl>
1 (Intercept) 0.769 0.528 1.46 1.47e- 1
2 cty 1.35 0.0305 44.2 6.32e-97
Geef een getraind parsnip-model door aan predict()
new_data geeft de dataset voor voorspellingen
Gestandaardiseerde output van predict()
new_data.predhwy_predictions <- lm_fit %>% predict(new_data = mpg_test)hwy_predictions
# A tibble: 57 x 1
.pred
<dbl>
1 25.0
2 27.7
3 25.0
4 25.0
5 22.3
# ... with 47 more rows
De functie bind_cols()
Stappen
hwy en cty uit mpg_testbind_cols() en voeg de voorspellingen toempg_test_results <- mpg_test %>% select(hwy, cty) %>%bind_cols(hwy_predictions) mpg_test_results
# A tibble: 57 x 3
hwy cty .pred
<int> <int> <dbl>
1 29 18 25.0
2 31 20 27.7
3 27 18 25.0
4 26 18 25.0
5 25 16 22.3
# ... with 47 more rows
Modelleren met tidymodels in R