Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)
David Cecchini
Data Scientist
Avantajlar:
one_hot = np.array((N, 100000))
embedd = np.array((N, 300))
king - man + woman = queenDezavantajlar:
Keras'ta:
from tensorflow.keras.layers import Embeddingmodel = Sequential() # İlk katman olarak kullanın model.add(Embedding(input_dim=100000,output_dim=300,trainable=True,embeddings_initializer=None,input_length=120))
Dil modelleri için aktarım öğrenmesi
Keras'ta:
from tensorflow.keras.initializers import Constantmodel.add(Embedding(input_dim=vocabulary_size, output_dim=embedding_dim,embeddings_initializer=Constant(pre_trained_vectors))
Resmi site: https://nlp.stanford.edu/projects/glove/
# GloVE vektörlerini alın def get_glove_vectors(filename="glove.6B.300d.txt"): # Önceden eğitilmiş modelden tüm kelime vektörleri glove_vector_dict = {} with open(filename) as f: for line in f:values = line.split()word = values[0] coefs = values[1:]glove_vector_dict[word] = np.asarray(coefs, dtype='float32')return glove_vector_dict
# GloVE vektörlerini belirli bir göreve filtreleyin def filter_glove(vocabulary_dict, glove_dict, wordvec_dim=300):# Vektörleri saklamak için bir matris oluşturun embedding_matrix = np.zeros((len(vocabulary_dict) + 1, wordvec_dim))for word, i in vocabulary_dict.items(): embedding_vector = glove_dict.get(word)if embedding_vector is not None: # glove_dict'te bulunamayan kelimeler sıfır vektör olur. embedding_matrix[i] = embedding_vectorreturn embedding_matrix
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)