Cara kerja regresi linear

Regresi Tingkat Menengah di R

Richie Cotton

Data Evangelist at DataCamp

Plot standar regresi linear sederhana

Plot sebar dengan garis tren regresi linear.

Regresi Tingkat Menengah di R

Memvisualisasikan residual

Plot sebar dengan garis tren regresi linear, plus segmen dari titik ke garis tren yang mewakili residual.

Regresi Tingkat Menengah di R

Metrik untuk kecocokan terbaik

Gagasan paling sederhana (yang tidak berhasil)

  • Jumlahkan semua residual.
  • Beberapa residual bernilai negatif.

Gagasan berikutnya (yang berhasil)

  • Kuadratkan tiap residual, lalu jumlahkan.
  • Ini disebut "jumlah kuadrat".
Regresi Tingkat Menengah di R

Singgahan ke optimisasi numerik

Plot garis dari persamaan kuadrat

xy_data <- tibble(
  x = seq(-4, 5, 0.1),
  y = x ^ 2 - x + 10
)

ggplot(xy_data, aes(x, y)) + 
  geom_line()

line-quad.png

Regresi Tingkat Menengah di R

Menggunakan kalkulus untuk menyelesaikan persamaan

$y = x ^ 2 - x + 10$

$\frac{\partial y}{\partial x} = 2 x - 1$

$0 = 2 x - 1$

$x = 0.5$

$y = 0.5 ^ 2 - 0.5 + 10 = 9.75$

  • Tidak semua persamaan bisa diselesaikan seperti ini.
  • Anda dapat membiarkan R yang menghitungnya.

solusi garis dan kuadrat

Regresi Tingkat Menengah di R

optim()

calc_quadratic <- function(x) {
  x ^ 2 - x + 10
}
optim(par = 3, fn = calc_quadratic)
$par
[1] 0.4998047

$value
[1] 9.75

$counts
function gradient 
      30       NA 

$convergence
[1] 0

$message
NULL
Regresi Tingkat Menengah di R

Sedikit penyempurnaan

calc_quadratic <- function(coeffs) {
  x <- coeffs[1]
  x ^ 2 - x + 10
}
optim(par = c(x = 3), fn = calc_quadratic)
$par
        x 
0.4998047 

$value
[1] 9.75

$counts
function gradient 
      30       NA 

$convergence
[1] 0

$message
NULL
Regresi Tingkat Menengah di R

Algoritme regresi linear

  1. Definisikan fungsi untuk menghitung metrik jumlah kuadrat.
  2. Panggil optim() untuk mencari koefisien yang meminimalkan fungsi ini.
calc_sum_of_squares <- function(coeffs) {

intercept <- coeffs[1] slope <- coeffs[2]
# More calculation!
}
optim(
  par = ???,
  fn = ???
)
Regresi Tingkat Menengah di R

Ayo berlatih!

Regresi Tingkat Menengah di R

Preparing Video For Download...