Menggabungkan semuanya

Analisis Sentimen dengan Python

Violeta Misheva

Data Scientist

Masalah Analisis Sentimen

Analisis sentimen adalah proses memahami opini penulis tentang suatu topik

  • Ulasan film
  • Ulasan produk Amazon
  • Sentimen maskapai di Twitter
  • Beragam contoh sastra bermuatan emosi
Analisis Sentimen dengan Python

Eksplorasi ulasan

  • Info dasar ukuran ulasan
  • Word cloud
  • Fitur panjang ulasan: jumlah kata, jumlah kalimat
  • Fitur deteksi bahasa ulasan
Analisis Sentimen dengan Python

Transformasi numerik kolom pembawa sentimen

  • Bag-of-words
  • Vektorisasi TfIdf
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
# Sintaks vektorisasi
vect = CountVectorizer().fit(data.text_column)
X = vect.transform(data.text_column)
Analisis Sentimen dengan Python

Argumen vektorisator

  • stop words: kata sering muncul, kurang informatif
  • rentang n-gram: gunakan frasa, bukan hanya kata tunggal
  • kendalikan ukuran kosakata: max_features, max_df, min_df
  • menangkap pola token: hapus digit atau karakter tertentu

Penting tetapi BUKAN argumen untuk vektorisator

  • lemma dan stem
Analisis Sentimen dengan Python

Model pembelajaran terawasi

  • Klasifier regresi logistik untuk memprediksi sentimen
  • Dievaluasi dengan akurasi dan confusion matrix
  • Pentingnya train/test split
Analisis Sentimen dengan Python

Ayo berlatih!

Analisis Sentimen dengan Python

Preparing Video For Download...