Veri ön işleme

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

David Cecchini

Data Scientist

Metin sınıflandırma

Metin sınıflandırmanın kullanım alanları:

  • Otomatik haber sınıflandırma
  • İş dokümanı sınıflandırma
  • Destek taleplerinde kuyruk segmentasyonu
  • Daha fazlası!
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

İkili sınıflandırmadan farklar

İkili sınıflamadan çok sınıflıya geçince değişenler:

  • Çıkış değişkeni y'nin şekli
  • Çıkış katmanındaki birim sayısı
  • Çıkış katmanının aktivasyon işlevi
  • Kayıp fonksiyonu
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

İkili sınıflandırmadan farklar

Çıkış değişkeni y'nin şekli:

  • Sınıfların one-hot kodlaması
# Example: num_classes = 3
y[0] = [0, 1, 0]
y.shape = (N, num_classes)

Çıkış katmanındaki birim sayısı:

# Output layer
model.add(Dense(num_classes))
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

İkili sınıflandırmadan farklar

Tek boyutta ve uzayda sayıların farkı; one-hot kodlamanın kullanımını gösterir

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

İkili sınıflandırmadan farklar

Çıkış katmanındaki aktivasyon işlevi:

  • softmax her sınıfın olasılığını verir
# Output layer
model.add(Dense(num_classes, activation="softmax"))

Kayıp fonksiyonu:

  • İkili yerine kategorik çapraz entropi kullanılır
# Compile the model
model.compile(loss='categorical_crossentropy')
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Keras için metin kategorilerini hazırlama

y = ["sports", "economy", "data_science", "sports", "finance"]
# Transform to pandas series object
y_series = pd.Series(y, dtype="category")

# Print the category codes print(y_series.cat.codes)
0    3
1    1
2    0
3    3
4    2
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

y için ön işleme

from tensorflow.keras.utils import to_categorical

y = np.array([0, 1, 2]) # Kategorik formata çevir y_prep = to_categorical(y) print(y_prep)
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]
Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Hadi pratik yapalım!

Keras ile Dil Modellemesi için Yinelenen Sinir Ağları (RNN)

Preparing Video For Download...