Gözden geçirme
- Temel özellikler (karakterler, kelimeler, bahsetmeler vb.)
- Okunabilirlik puanları
- Tokenizasyon ve lemmatizasyon
- Metin temizleme
- Sözcük türü etiketleme ve adlandırılmış varlık tanıma
- n-gram modelleme
- tf-idf
- Kosinüs benzerliği
- Kelime gömmeleri