Pengantar Deep Learning dengan PyTorch
Jasmin Ludolf
Senior Data Science Content Developer, DataCamp
$$
Turunan merepresentasikan kemiringan kurva
$$
$$

Ini adalah fungsi konveks

Ini adalah fungsi non-konveks

$$

$$

$$
Pertimbangkan jaringan dengan tiga lapisan:

# Jalankan forward pass model = nn.Sequential(nn.Linear(16, 8), nn.Linear(8, 4), nn.Linear(4, 2)) prediction = model(sample)# Hitung loss dan gradien criterion = CrossEntropyLoss() loss = criterion(prediction, target) loss.backward()
# Akses gradien tiap lapisan
model[0].weight.grad
model[0].bias.grad
model[1].weight.grad
model[1].bias.grad
model[2].weight.grad
model[2].bias.grad
# Learning rate biasanya kecil lr = 0.001 # Perbarui bobot weight = model[0].weight weight_grad = model[0].weight.gradweight = weight - lr * weight_grad# Perbarui bias bias = model[0].bias bias_grad = model[0].bias.gradbias = bias - lr * bias_grad
$$
Untuk fungsi non-konveks, kita gunakan gradient descent
PyTorch mempermudah dengan optimizer
import torch.optim as optim # Buat optimizer optimizer = optim.SGD(model.parameters(), lr=0.001)# Lakukan pembaruan parameter optimizer.step()
Pengantar Deep Learning dengan PyTorch