Funciones de activación ReLU

Introducción al aprendizaje profundo con PyTorch

Jasmin Ludolf

Senior Data Science Content Developer, DataCamp

Funciones sigmoide y softmax

Una red neuronal con función sigmoide

Una red neuronal con función softmax

Función sigmoide:

Gradientes:

Muy pequeño para valores grandes y pequeños de x
Provocan la saturación, lo que conduce al problema de desvanecimiento de gradientes

La función softmax también sufre saturación

La función sigmoide

Unidad lineal rectificada o Rectified Linear Unit (ReLU):

En PyTorch:

relu = nn.ReLU()

Función ReLU

Leaky ReLu:

Las entradas positivas se comportan como ReLU
Las entradas negativas se escalan con un coeficiente pequeño (por defecto 0,01)
Los gradientes de las entradas negativas son distintos de cero

En PyTorch:

leaky_relu = nn.LeakyReLU(
  negative_slope = 0.05)

Leaky ReLu

Introducción al aprendizaje profundo con PyTorch