Introdução ao Aprendizado Profundo com o PyTorch
Jasmin Ludolf
Senior Data Science Content Developer, DataCamp
Problema | Soluções |
---|---|
Conjunto de dados não é grande o suficiente | Obter mais dados / usar aumento de dados |
O modelo tem capacidade excessiva | Reduzir tamanho do modelo/adicionar dropout |
Pesos são muito grandes | Decaimento de peso |
Estratégias:
model = nn.Sequential(nn.Linear(8, 4),
nn.ReLU(),
nn.Dropout(p=0.5))
features = torch.randn((1, 8))
print(model(features))
tensor([[1.4655, 0.0000, 0.0000, 0.8456]], grad_fn=<MulBackward0>)
model.train()
para treinamento e model.eval()
para desativar o dropout durante a avaliação.optimizer = optim.SGD(model.parameters(), lr=0.001, weight_decay=0.0001)
weight_decay
no otimizador, definido como um valor pequeno (ex.: 0.0001)Introdução ao Aprendizado Profundo com o PyTorch