2010-11-15 6 views
35

Ich fragte mich, ob jemand wüsste, wo ich Wörterbücher für positive und negative Wörter bekommen konnte. Ich untersuche die Stimmungsanalyse und das ist ein entscheidender Teil davon.Sentiment Analyse Wörterbücher

Antwort

32

Die Sentiment Lexicon, an der University of Pittsburgh könnte sein, was Sie wollen. Es ist ein Lexikon von etwa 8.000 Wörtern mit positiver/neutraler/negativer Stimmung. Es wird detaillierter in this paper beschrieben und unter der GPL veröffentlicht.

6

This paper from 2002 beschreibt einen Algorithmus zum automatischen Ableiten eines solchen Wörterbuchs aus Textproben, wobei nur zwei Wörter als Seed-Set verwendet werden.

+3

Das Problem ist, dass dieser Ansatz verwendet AltaVista trifft PMI-IR zu berechnen, so dass ich glaube nicht, dass es für jemanden optimal ist, die ersten Schritte will. Darüber hinaus ist es ein unbeaufsichtigter Ansatz und seine Ergebnisse sind im Vergleich zu überwachten Ansätzen immer noch nicht aufregend. –

19

Etwas spät komme ich nur darauf, dass Wörterbücher einen begrenzten Beitrag zur Stimmungsanalyse haben. Einige Gefühle, die Sätze enthalten, enthalten kein "Gefühls" -Wort - z. "lese das Buch", was in einer Buchbesprechung positiv sein könnte, während es in einer Filmbesprechung negativ ist. Ähnlich könnte das Sentiment Wort "unberechenbar" im Zusammenhang mit einem Thriller positiv sein, aber negativ bei der Beschreibung der Pausen-System des Toyota.

und es gibt viele mehr ...

+0

Wirklich gute Punkte. Zum Glück für mich habe ich nur mit bestimmten Nachrichtenquellen zu tun, die Slang nicht verwenden und im Allgemeinen nur Tatsachen angeben. Immer noch etwas, worüber man sich Sorgen machen muss, danke. – user387049

+2

Ich denke, wenn Wörterbücher ohne Kontext verwendet werden, besteht die Hoffnung darin, dass es zwar ein gewisses Maß an Rauschen (Fehlklassifizierung) für einzelne Sätze gibt, dass jedoch genug Signal in der Gesamtheit sinnvoll ist. Ich bin mir nicht sicher, wie man diese Hoffnung mit statistischer Strenge testen würde. – mcduffee

2

AFINN finden Sie hier und es auch schaffen dynamisch. Wie immer, wenn unbekannt + ve Wort kommt, addiere es mit +1. Wie Banane ist neu + ve Wort und erscheint zweimal, dann wird es +2.

So viele Artikel und Daten, die Sie knacken, würde Ihr Wörterbuch stärker werden!

+3

Diese Datei ist wirklich eine Spielzeugdatei, die für eine Klassenzuweisung erstellt wurde. Meiner Meinung nach wäre es ein Fehler, es für echte Arbeit zu verwenden. – mcduffee

+0

@mcduffee Aufwendig? – jbird

+0

@jbird Ich bin mir nicht sicher, was ich hinzufügen kann. Die Datei wurde für eine Klassenzuweisung erstellt, wobei der auszuwertende Text auf die Wörter in der Liste zugeschnitten war. Es fehlen viele, viele Wörter (die gesamte Liste ist weniger als 2500 Wörter). Der Versuch, es mit Text zu verwenden, der nicht auf die Wörter in der Liste zugeschnitten ist, würde, wie ich fürchte, zu weniger genauen Einschätzungen der Stimmung führen, als eine vollständigere Liste bieten würde. – mcduffee

16
0

Sie können vader Stimmungs Lexikon

from nltk.sentiment.vader import SentimentIntensityAnalyzer 

sentence='APPle is good for health' 
sid = SentimentIntensityAnalyzer() 
ss = sid.polarity_scores(sentence) 
print(ss) 

es werden Ihnen die Polarität des Satzes verwenden.

Ausgabe:

{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0} 
Verwandte Themen