Analisis Sentimen dengan Python
Violeta Misheva
Data Scientist
Stemming adalah proses mengubah kata ke bentuk akarnya, meski stem itu sendiri bisa jadi bukan kata valid dalam bahasa.
staying, stays, stayed ----> stay
house, houses, housing ----> hous
Lemmatisasi mirip dengan stemming, tetapi mengembalikan kata ke bentuk dasar yang merupakan kata valid dalam bahasa.
stay, stays, staying, stayed ----> stay
house, houses, housing ----> house
Stemming
Lemmatisasi
from nltk.stem import PorterStemmer
porter = PorterStemmer()
porter.stem('wonderful')
'wonder'
Snowball Stemmer: Denmark, Belanda, Inggris, Finlandia, Prancis, Jerman, Hungaria, Italia, Norwegia, Portugis, Rumania, Rusia, Spanyol, Swedia
from nltk.stem.snowball import SnowballStemmer
DutchStemmer = SnowballStemmer("dutch")
DutchStemmer.stem("beginnen")
'begin'
porter.stem('Today is a wonderful day!')
'today is a wonderful day!'
tokens = word_tokenize('Today is a wonderful day!')
stemmed_tokens = [porter.stem(token) for token in tokens]
stemmed_tokens
['today', 'is', 'a', 'wonder', 'day', '!']
from nltk.stem import WordNetLemmatizer
WNlemmatizer = WordNetLemmatizer()
WNlemmatizer.lemmatize('wonderful', pos='a')
'wonderful'
Analisis Sentimen dengan Python