Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
David Cecchini
Data Scientist


Örnek: $$a_2 = f(W_a, a_1, x_2)$$
$$= f(W_a, f(W_a, a_0, x_1), x_2)$$

Unutmayın:
$$ a_T = f(W_a, a_{T-1}, x_T) $$
$a_T$, $a_{T-1}$’e; o da $a_{T-2}$ ve $W_a$’ya vb. bağlıdır!
Türevleri hesaplamak şuna yol açar
$$ \frac{\partial a_t}{\partial W_a} = (W_a)^{t-1}g(X) $$
$(W_a)^{t-1}$ 0’a yakınsayabilir
veya $+\infty$’ye sapabilir!
Bazı çözümler bilinir:
Patlayan gradyanlar
Kaybolan gradyanlar
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)