NMT modelini eğitme

Keras ile Machine Translation

Thushan Ganegedara

Data Scientist and Author

Modeli yeniden gözden geçirme

  • Encoder GRU
    • İngilizce kelimeleri alır
    • Bir bağlam vektörü üretir
  • Decoder GRU
    • Bağlam vektörünü alır
    • Bir GRU çıktı dizisi üretir
  • Decoder Tahmin katmanı
    • GRU çıktı dizisini alır
    • Fransızca kelimeler için olasılıklar üretir

Keras ile Machine Translation

Parametreleri optimize etme

  • GRU ve Dense katmanlarının parametreleri vardır
  • Genellikle W (ağırlıklar) ve b (bias) ile gösterilir (rastgele başlatılır)
  • Bir girdiyi faydalı çıktıya dönüştürmekten sorumludur
  • Bir optimizer ile kaybı en aza indirmek için zamanla değiştirilir
    • Kayıp: Şunların farkı olarak hesaplanır:
      • Tahminler (örn. modelin ürettiği Fransızca kelimeler)
      • Gerçek çıktılar (örn. gerçek Fransızca kelimeler).
  • Model derlenirken belirtilir
nmt.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['acc'])
Keras ile Machine Translation

Modeli eğitme

  • Eğitim yinelemeleri
    for ei in range(n_epochs): # Veri kümesinde tek geçiş
      for i in range(0,data_size,bsize): # Tek bir batch işleme
    
  • Bir eğitim batch'i alma
      en_x = sents2seqs('source', en_text[i:i+bsize], onehot=True, reverse=True)
      de_y = sents2seqs('target', en_text[i:i+bsize], onehot=True)
    
  • Tek bir batch üzerinde eğitim
      nmt.train_on_batch(en_x, de_y)
    
  • Modeli değerlendirme
      res = nmt.evaluate(en_x, de_y, batch_size=bsize, verbose=0)
    
Keras ile Machine Translation

Modeli eğitme

  • Eğitim kaybı ve doğruluğu alma
      res = nmt.evaluate(en_x, de_y, batch_size=bsize, verbose=0)
      print("Epoch {} => Train Loss:{}, Train Acc: {}".format(
        ei+1,res[0], res[1]*100.0))
    
Epoch 1 => Train Loss:4.8036723136901855, Train Acc: 5.215999856591225
...
Epoch 1 => Train Loss:4.718592643737793, Train Acc: 47.0880001783371
...
Epoch 5 => Train Loss:2.8161656856536865, Train Acc: 56.40000104904175
Epoch 5 => Train Loss:2.527724266052246, Train Acc: 54.368001222610474
Epoch 5 => Train Loss:2.2689621448516846, Train Acc: 54.57599759101868
Epoch 5 => Train Loss:1.9934935569763184, Train Acc: 56.51199817657471
Epoch 5 => Train Loss:1.7581449747085571, Train Acc: 55.184000730514526
Epoch 5 => Train Loss:1.5613118410110474, Train Acc: 55.11999726295471
Keras ile Machine Translation

Aşırı öğrenmeden kaçınma

  • Veri kümesini ikiye ayırın
    • Eğitim seti - Model bununla eğitilecek
    • Doğrulama seti - Modelin doğruluğu bununla izlenecek
  • Doğrulama doğruluğu artmayı durdurduğunda, eğitimi durdurun.

Aşırı öğrenme noktası

Keras ile Machine Translation

Veri kümesini bölme

  • Eğitim ve doğrulama veri kümesi boyutlarını tanımlayın

    train_size, valid_size = 800, 200
    
  • Veri indislerini rastgele karıştırın

    inds = np.arange(len(en_text))
    np.random.shuffle(inds)
    
  • Eğitim ve doğrulama indislerini alın

    train_inds = inds[:train_size]
    valid_inds = inds[train_size:train_size+valid_size]
    
Keras ile Machine Translation

Veri kümesini bölme

  • Veri kümesini şu şekilde ayırın:
    • Eğitim indislerine sahip verileri eğitim setine koyun
    • Doğrulama indislerine sahip verileri doğrulama setine koyun
tr_en = [en_text[ti] for ti in train_inds]
tr_fr = [fr_text[ti] for ti in train_inds]

v_en = [en_text[ti] for ti in valid_inds]
v_fr = [fr_text[ti] for ti in valid_inds]
Keras ile Machine Translation

Doğrulama ile modeli eğitme

n_epochs, bsize = 5, 250
for ei in range(n_epochs):

for i in range(0,train_size,bsize): en_x = sents2seqs('source', tr_en[i:i+bsize], onehot=True, pad_type='pre') de_y = sents2seqs('target', tr_fr[i:i+bsize], onehot=True) nmt.train_on_batch(en_x, de_y)
v_en_x = sents2seqs('source', v_en, onehot=True, pad_type='pre') v_de_y = sents2seqs('target', v_fr, onehot=True)
res = nmt.evaluate(v_en_x, v_de_y, batch_size=valid_size, verbose=0) print("Epoch: {} => Loss:{}, Val Acc: {}".format(ei+1,res[0], res[1]*100.0))
Epoch 1 => Train Loss:4.8036723136901855, Train Acc: 5.215999856591225
Keras ile Machine Translation

Ayo berlatih!

Keras ile Machine Translation

Preparing Video For Download...