Memahami model sekuensial

Penerjemahan Mesin dengan Keras

Thushan Ganegedara

Data Scientist and Author

Input deret waktu dan model sekuensial

  • Kalimat adalah input deret waktu
    • Kata saat ini dipengaruhi kata sebelumnya
    • Mis. He went to the pool for a ....
  • Encoder/decoder menggunakan model machine learning
    • Model yang belajar dari input deret waktu
    • Disebut model sekuensial
Penerjemahan Mesin dengan Keras

Model sekuensial

  • Model sekuensial
    • Melintasi input dan menghasilkan output di tiap langkah waktu

Arsitektur model sekuensial

Penerjemahan Mesin dengan Keras

Encoder sebagai model sekuensial

  • GRU - Gated Recurrent Unit

Unit berulang berpagar

Penerjemahan Mesin dengan Keras

Pengenalan layer GRU

Pada langkah waktu 1, layer GRU:

  • Mengonsumsi input "We"
  • Mengonsumsi state awal (0,0)
  • Menghasilkan state baru (0.8, 0.3)

GRU 1

Penerjemahan Mesin dengan Keras

Pengenalan layer GRU

Pada langkah waktu 2, layer GRU:

  • Mengonsumsi input "like"
  • Mengonsumsi state awal (0.8,0.3)
  • Menghasilkan state baru (0.5, 0.9)

Hidden state merepresentasikan “memori” dari apa yang telah dilihat model

GRU 2

Penerjemahan Mesin dengan Keras

Kilas balik Keras (Functional API)

  • Keras memiliki dua objek penting: objek Layer dan Model.
  • Input layer
    • inp = keras.layers.Input(shape=(...))
  • Hidden layer
    • layer = keras.layers.GRU(...)
  • Output
    • out = layer(inp)
  • Model
    • model = Model(inputs=inp, outputs=out)
Penerjemahan Mesin dengan Keras

Memahami bentuk data

  • Data sekuensial berdimensi 3
    • Dimensi batch (mis. batch = grup kalimat)
    • Dimensi waktu - panjang sekuens
    • Dimensi input (mis. panjang vektor onehot)
  • Bentuk input model GRU
    • (Batch, Time, Input)
    • (ukuran batch, panjang sekuens, panjang onehot)

Data input

Penerjemahan Mesin dengan Keras

Menerapkan GRU dengan Keras

Mendefinisikan layer Keras

inp = keras.layers.Input(batch_shape=(2,3,4))
gru_out = keras.layers.GRU(10)(inp)

Mendefinisikan model Keras

model = keras.models.Model(inputs=inp, outputs=gru_out)
Penerjemahan Mesin dengan Keras

Menerapkan GRU dengan Keras

Memprediksi dengan model Keras

x = np.random.normal(size=(2,3,4))
y = model.predict(x)
print("shape (y) =", y.shape, "\ny = \n", y)
shape (y) = (2, 10) 
y = 
[[ 0.2576233   0.01215531  ... -0.32517594  0.4483121 ],
 [ 0.54189587 -0.63834655  ... -0.4339783   0.4043917 ]]
Penerjemahan Mesin dengan Keras

Menerapkan GRU dengan Keras

GRU yang menerima jumlah sampel batch arbitrer

inp = keras.layers.Input(shape=(3,4))
gru_out = keras.layers.GRU(10)(inp)
model = keras.models.Model(inputs=inp, outputs=gru_out)
x = np.random.normal(size=(5,3,4))
y = model.predict(x)
print("y = \n", y)
y = 
 [[-1.3941444e-02 -3.3123985e-02 ... 6.5081201e-02  1.1245312e-01]
 [ 1.1409521e-03  3.6983326e-01 ... -3.4610277e-01 -3.4792548e-01]
 [ 2.5911796e-01 -3.9517123e-01 ... 5.8505309e-01  3.6908010e-01]
 [-2.8727052e-01 -5.1150680e-02 ... -1.9637148e-01 -1.5587148e-01]
 [ 3.1303680e-01  2.3338445e-01 ... 9.1499090e-04 -2.0590121e-01]]
Penerjemahan Mesin dengan Keras

Argumen return_state pada layer GRU

inp = keras.layers.Input(batch_shape=(2,3,4))
gru_out2, gru_state = keras.layers.GRU(10, return_state=True)(inp)
print("gru_out2.shape = ", gru_out2.shape)
print("gru_state.shape = ", gru_state.shape)
gru_out2.shape =  (2, 10)
gru_state.shape =  (2, 10)

GRU return_state

Penerjemahan Mesin dengan Keras

Argumen return_sequences pada layer GRU

inp = keras.layers.Input(batch_shape=(2,3,4))
gru_out3 = keras.layers.GRU(10, return_sequences=True)(inp)
print("gru_out3.shape = ", gru_out2.shape)
gru_out3.shape =  (2, 3, 10)

GRU return_sequences

Penerjemahan Mesin dengan Keras

Ayo berlatih!

Penerjemahan Mesin dengan Keras

Preparing Video For Download...