Dil modellerinde transfer öğrenme

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

David Cecchini

Data Scientist

Transfer öğrenmenin temel fikri

Transfer öğrenme:

  • Rastgeleye göre daha iyi başlangıç ağırlıklarıyla başlama
  • Çok büyük veri kümelerinde eğitilmiş modelleri kullanma
  • "Açık kaynak" veri bilimi modelleri
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Mevcut mimariler

Temel örnek: I really loved this movie

  • Word2Vec
    • Sürekli Kelime Torbası (CBOW) X = [I, really, this, movie], y = loved
    • Skip-gram X = loved, y = [I, really, this, movie]
  • FastText X = [I, rea, eal, all, lly, really, ...], y = loved
    • Kelimeleri ve karakter n-gramlarını kullanır
  • ELMo X = [I, really, loved, this], y = movie
    • Kelimeler ve bağlama göre gömme vektörleri kullanır
    • Derin çift yönlü dil modelleri (biLM) kullanır
  • Word2Vec ve FastText gensim paketinde, ELMo tensorflow_hub üzerinde mevcuttur
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Word2Vec ile örnek

from gensim.models import word2vec

# Train the model w2v_model = word2vec.Word2Vec(tokenized_corpus, size=embedding_dim, window=neighbor_words_num, iter=100)
# Get top 3 similar words to "captain" w2v_model.wv.most_similar(["captain"], topn=3)
[('sweatpants', 0.7249663472175598),
('kirk', 0.7083336114883423),
('larry', 0.6495886445045471)]
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

FastText ile örnek

from gensim.models import fasttext

# Instantiate the model ft_model = fasttext.FastText(size=embedding_dim, window=neighbor_words_num)
# Build vocabulary ft_model.build_vocab(sentences=tokenized_corpus)
# Train the model ft_model.train(sentences=tokenized_corpus, total_examples=len(tokenized_corpus), epochs=100)
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Hadi pratik yapalım!

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Preparing Video For Download...