Introductie tot Deep Learning met PyTorch
Jasmin Ludolf
Senior Data Science Content Developer, DataCamp
| Probleem | Oplossingen |
|---|---|
| Dataset is niet groot genoeg | Meer data verzamelen / data-augmentatie |
| Model heeft te veel capaciteit | Model verkleinen / dropout toevoegen |
| Gewichten zijn te groot | Weight decay |
Strategieën:
model = nn.Sequential(nn.Linear(8, 4),
nn.ReLU(),
nn.Dropout(p=0.5))
features = torch.randn((1, 8))
print(model(features))
tensor([[1.4655, 0.0000, 0.0000, 0.8456]], grad_fn=<MulBackward0>)
model.train() voor training en model.eval() om dropout uit te zetten tijdens evaluatieoptimizer = optim.SGD(model.parameters(), lr=0.001, weight_decay=0.0001)
weight_decay-parameter in de optimizer, meestal klein (bijv. 0.0001)
Introductie tot Deep Learning met PyTorch