2016-05-30 7 views
2

Ich habe R sentiment Paket für Sentiment-Analyse verwendet. Ich war schockiert, als einige triviale Negative für viele meiner Dokumente positiv waren. Zum BeispielVerwirrt mit "Sentiment" -Paket in R?

library("sentiment") 
classify_polarity("Not good") 

#  POS    NEG     POS/NEG   BEST_FIT 
# [1,] "8.78232285939751" "0.445453222112551" "19.7154772340574" "positive" 

Ich bin mir nicht sicher, was dahinter passiert. Kann jemand das klären?

+0

[möglicherweise relevant] (http://stackoverflow.com/questions/15194436/is-there-any-other-package-other-than-sentiment-to-do-sentiment-analysis-in-r). plus diese Funktion sollte nicht eine Matrix zurückgeben, das war eine schlechte Design-Wahl – rawr

+0

@rawr danke. Ich habe gerade den Quellcode durchgelesen. Dies bewertet jedes Wort und summiert sich für das Ganze. "gut" hat eine relativ hohe Punktzahl als "nicht", bleibt positiv. Kann ich eine andere korrekte Implementierung in R für die Sentimentanalyse haben? – Fitzerbirth

+0

hast du auf den Link geklickt? – rawr

Antwort

3

Danke rawr. Ich fand das hilfreich.

>library(qdap) 
> polarity("Not Good") 
    all total.sentences total.words ave.polarity sd.polarity stan.mean.polarity 
    1 all    1   2  -0.707   NA     NA 
> polarity("It's cool but not great") 
    all total.sentences total.words ave.polarity sd.polarity stan.mean.polarity 
    1 all    1   5  -0.894   NA     NA 
> polarity("It's awesome") 
    all total.sentences total.words ave.polarity sd.polarity stan.mean.polarity 
    1 all    1   2  0.707   NA     NA