Laten we het sentiment voorspellen!

Sentimentanalyse in Python

Violeta Misheva

Data Scientist

Classificatieproblemen

  • Product- en filmreviews: positief of negatief (binaire classificatie)
  • Tweets over luchtvaartmaatschappijen: positief, neutraal en negatief (multiklassenclassificatie)
Sentimentanalyse in Python

Lineaire en logistische regressie

een grafiek met links een lineaire regressie voor enkele waarden en rechts een logistische regressie voor vergelijkbare waarden

Sentimentanalyse in Python

Logistische functie

  • Lineaire regressie: numerieke uitkomst
  • Logistische regressie: kans:

$$ Probability(sentiment=positive|review) $$

een grafiek met een logistische (sigmoid) functie, gefit op enkele voorbeelden

Sentimentanalyse in Python

Logistische regressie in Python

from sklearn.linear_model import LogisticRegression
log_reg = LogisticRegression().fit(X, y)
Sentimentanalyse in Python

Modelprestatie meten

Accuracy: aandeel correcte voorspellingen van het model.

  • Hoe hoger en dichter bij 1, hoe beter
# Accuracy met score
score = log_reg.score(X, y)
print(score)
0.9009
Sentimentanalyse in Python

Accuracy gebruiken

# Accuracy met accuracy_score
from sklearn.metrics import accuracy_score
y_predicted = log_reg.predict(X)
acurracy = accuracy_score(y, y_predicted)
0.9009
Sentimentanalyse in Python

Laten we oefenen!

Sentimentanalyse in Python

Preparing Video For Download...