Sentimentclassificatie herzien

Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

David Cecchini

Data Scientist

Eerdere resultaten

Ons eerste model presteerde slecht.

model = Sequential()
model.add(SimpleRNN(units=16, input_shape=(None, 1)))
model.add(Dense(1, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['accuracy'])

model.evaluate(x_test, y_test)
$[0.6991182165145874, 0.495]
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Model verbeteren

Om de prestaties te verbeteren, kun je:

  • Een embedding-laag toevoegen
  • Meer lagen gebruiken
  • Hyperparameters tunen
  • De woordenschat vergroten
  • Langere zinnen toestaan met meer geheugencellen
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Overfitting vermijden

RNN-modellen kunnen overfitten

  • Test verschillende batchgroottes.
  • Voeg Dropout-lagen toe.
  • Gebruik dropout en recurrent_dropout in RNN-lagen.
# verwijdert 20% van de input om ruis toe te voegen
model.add(Dropout(rate=0.2))

# Verwijdert respectievelijk 10% van input en geheugencellen model.add(LSTM(128, dropout=0.1, recurrent_dropout=0.1))
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Extra: Convolution-laag

Buiten scope:

model.add(Embedding(vocabulary_size, wordvec_dim, ...))
model.add(Conv1D(num_filters=32, kernel_size=3, padding='same'))
model.add(MaxPooling1D(pool_size=2))
  • Convolutielagen selecteren features in de embeddingvector
  • State-of-the-art voor veel NLP-taken
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Voorbeeldmodel

model = Sequential()
model.add(Embedding(  vocabulary_size, wordvec_dim, trainable=True,
                      embeddings_initializer=Constant(glove_matrix), 
                      input_length=max_text_len, name="Embedding"))

model.add(Dense(wordvec_dim, activation='relu', name="Dense1"))
model.add(Dropout(rate=0.25)) model.add(LSTM(64, return_sequences=True, dropout=0.15, name="LSTM"))
model.add(GRU(64, return_sequences=False, dropout=0.15, name="GRU"))
model.add(Dense(64, name="Dense2")) model.add(Dropout(rate=0.25)) model.add(Dense(32, name="Dense3"))
model.add(Dense(1, activation='sigmoid', name="Output"))
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Laten we oefenen!

Recurrent Neural Networks (RNN's) voor taalmodellen met Keras

Preparing Video For Download...