Lapisan Dense dan TimeDistributed

Penerjemahan Mesin dengan Keras

Thushan Ganegedara

Data Scientist and Author

Pengantar lapisan Dense

  • Menerima vektor masukan dan mengubahnya menjadi prediksi probabilistik.
    • y = Bobot.x + Bias

Bobot dan bias

Penerjemahan Mesin dengan Keras

Memahami lapisan Dense

Mendefinisikan dan menggunakan lapisan Dense

dense = Dense(3, activation='softmax')
inp = Input(shape=(3,))
pred = dense(inp)
model = Model(inputs=inp, outputs=pred)

Mendefinisikan lapisan Dense dengan inisialisasi kustom

from tensorflow.keras.initializers import RandomNormal
init = RandomNormal(mean=0.0, stddev=0.05, seed=6000)
dense = Dense(3, activation='softmax', 
             kernel_initializer=init, bias_initializer=init)
Penerjemahan Mesin dengan Keras

Masukan dan keluaran lapisan Dense

  • Lapisan softmax Dense
    • Menerima array (batch size, input size)
      • mis. x = [[1, 6, 8], [8, 9, 10]] # a 2x3 array
    • Menghasilkan array (batch size, num classes)
      • mis. Jumlah kelas = 4
      • mis. y = [[0.1, 0.3, 0.4, 0.2], [0.2, 0.5, 0.1, 0.2]] # a 2x4 array
    • Keluaran tiap sampel adalah distribusi probabilitas atas kelas
      • Menjumlah hingga 1 per kolom
    • Dapatkan kelas tiap sampel dengan np.argmax(y, axis=-1)
      • mis. np.argmax(y,axis=-1) menghasilkan [2,1]
Penerjemahan Mesin dengan Keras

Memahami lapisan TimeDistributed

  • Memungkinkan Dense memproses masukan deret waktu
dense_time = TimeDistributed(Dense(3, activation='softmax'))
inp = Input(shape=(2, 3))
pred = dense_time(inp)
model = Model(inputs=inp, outputs=pred)
Penerjemahan Mesin dengan Keras

Masukan dan keluaran lapisan TimeDistributed

  • Menerima array (batch size, sequence length, input size)
x = [[[1, 6], [8, 2], [1, 2]], 
    [[8, 9], [10, 8], [1, 0]]] # a 2x3x2 array
  • Menghasilkan array (batch size, sequence length, num classes)
    • mis. Jumlah kelas = 3
y = [[[0.1, 0.5, 0.4], [0.8, 0.1, 0.1], [0.6, 0.2, 0.2]], 
     [[0.2, 0.5, 0.3], [0.2, 0.5, 0.3], [0.2, 0.8, 0.0]]] # a 2x3x3 array
  • Keluaran tiap sampel adalah distribusi probabilitas atas kelas
  • Dapatkan kelas tiap sampel dengan np.argmax(y, axis=-1)
Penerjemahan Mesin dengan Keras

Memotong data pada dimensi waktu

y = [[[0.1, 0.5, 0.4], [0.8, 0.1, 0.1], [0.6, 0.2, 0.2]], 
     [[0.2, 0.5, 0.3], [0.2, 0.5, 0.3], [0.2, 0.8, 0.0]]] # a 2x3x3 array
classes = np.argmax(y, axis=-1) # a 2 x 3 array

Iterasi data terdistribusi waktu

for t in range(3):
  # Get the t-th time-dimension slice of y and classes
  for prob, c in zip(y[:,t,:], classes[:,t]):
     print("Prob: ", prob, ", Class: ", c)
Prob:  [0.1 0.5 0.4] , Class:  1
Prob:  [0.2 0.5 0.3] , Class:  1
Prob:  [0.8 0.1 0.1] , Class:  0
...
Penerjemahan Mesin dengan Keras

Ayo berlatih!

Penerjemahan Mesin dengan Keras

Preparing Video For Download...