Python ile Natural Language Processing (NLP)
Fouad Trad
Machine Learning Engineer

Bir metnin konusunu anlamak

Bir metnin konusunu anlamak

Metindeki her kelimenin gerekli olduğu görevler

NLTK, birçok dil için durak sözcük listesi sağlar
from nltk.corpus import stopwords nltk.download('stopwords')stop_words = stopwords.words('english')print(stop_words[:10])
['a', 'about', 'above', 'after', 'again', 'against', 'ain', 'all', 'am', 'an']
from nltk.tokenize import word_tokenizetext = "This is an example to demonstrate removing stop words."tokens = word_tokenize(text)# The .lower() method helps with case sensitivity filtered_tokens = [word for word in tokens if word.lower() not in stop_words]print(filtered_tokens)
['example', 'demonstrate', 'removing', 'stop', 'words', '.']

Belgelerde ortak ya da önemli kelimeleri bulmayı gerektiren görevler

Belgelerde ortak ya da önemli kelimeleri bulmayı gerektiren görevler

Anlam için cümle yapısını korumayı gerektiren görevler

import string
print(string.punctuation)
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
text = "This is an example to demonstrate removing stop words." tokens = word_tokenize(text) filtered_tokens = [word for word in tokens if word.lower() not in stop_words]clean_tokens = [word for word in filtered_tokens if word not in string.punctuation]print(clean_tokens)
['example', 'demonstrate', 'removing', 'stop', 'words']
Python ile Natural Language Processing (NLP)