Ich fragte mich, ob jemand wüsste, wo ich Wörterbücher für positive und negative Wörter bekommen konnte. Ich untersuche die Stimmungsanalyse und das ist ein entscheidender Teil davon.Sentiment Analyse Wörterbücher
Antwort
Die Sentiment Lexicon, an der University of Pittsburgh könnte sein, was Sie wollen. Es ist ein Lexikon von etwa 8.000 Wörtern mit positiver/neutraler/negativer Stimmung. Es wird detaillierter in this paper beschrieben und unter der GPL veröffentlicht.
This paper from 2002 beschreibt einen Algorithmus zum automatischen Ableiten eines solchen Wörterbuchs aus Textproben, wobei nur zwei Wörter als Seed-Set verwendet werden.
Etwas spät komme ich nur darauf, dass Wörterbücher einen begrenzten Beitrag zur Stimmungsanalyse haben. Einige Gefühle, die Sätze enthalten, enthalten kein "Gefühls" -Wort - z. "lese das Buch", was in einer Buchbesprechung positiv sein könnte, während es in einer Filmbesprechung negativ ist. Ähnlich könnte das Sentiment Wort "unberechenbar" im Zusammenhang mit einem Thriller positiv sein, aber negativ bei der Beschreibung der Pausen-System des Toyota.
und es gibt viele mehr ...
Wirklich gute Punkte. Zum Glück für mich habe ich nur mit bestimmten Nachrichtenquellen zu tun, die Slang nicht verwenden und im Allgemeinen nur Tatsachen angeben. Immer noch etwas, worüber man sich Sorgen machen muss, danke. – user387049
Ich denke, wenn Wörterbücher ohne Kontext verwendet werden, besteht die Hoffnung darin, dass es zwar ein gewisses Maß an Rauschen (Fehlklassifizierung) für einzelne Sätze gibt, dass jedoch genug Signal in der Gesamtheit sinnvoll ist. Ich bin mir nicht sicher, wie man diese Hoffnung mit statistischer Strenge testen würde. – mcduffee
Professor Bing Liu ein englisches Lexikon des Wortes über 6800 bereitzustellen, können Sie bilden diesen Link herunterladen: Opinion Mining, Sentiment Analysis, and Opinion Spam Detection
AFINN finden Sie hier und es auch schaffen dynamisch. Wie immer, wenn unbekannt + ve Wort kommt, addiere es mit +1. Wie Banane ist neu + ve Wort und erscheint zweimal, dann wird es +2.
So viele Artikel und Daten, die Sie knacken, würde Ihr Wörterbuch stärker werden!
Diese Datei ist wirklich eine Spielzeugdatei, die für eine Klassenzuweisung erstellt wurde. Meiner Meinung nach wäre es ein Fehler, es für echte Arbeit zu verwenden. – mcduffee
@mcduffee Aufwendig? – jbird
@jbird Ich bin mir nicht sicher, was ich hinzufügen kann. Die Datei wurde für eine Klassenzuweisung erstellt, wobei der auszuwertende Text auf die Wörter in der Liste zugeschnitten war. Es fehlen viele, viele Wörter (die gesamte Liste ist weniger als 2500 Wörter). Der Versuch, es mit Text zu verwenden, der nicht auf die Wörter in der Liste zugeschnitten ist, würde, wie ich fürchte, zu weniger genauen Einschätzungen der Stimmung führen, als eine vollständigere Liste bieten würde. – mcduffee
Sentiment Analysis (Opinion Mining) Lexicons
- MPQA Subjectivity Lexicon
- Bing Liu and Minqing Hu Sentiment Lexicon
- SentiWordNet (inklusive in NLTK)
- VADER Sentiment Lexicon
- SenticNet
- LIWC (not free)
- Harvard Inquirer
- ANEW
Quellen:
- Keenformatics - Sentiment Analysis lexicons and datasets (mein Blog)
- Hutto, C. J., and Eric Gilbert. "Vader: A parsimonious rule-based model for sentiment analysis of social media text." Eighth International AAAI Conference on Weblogs and Social Media. 2014.
- Sentiment Symposium Tutorial by Christopher Potts
- Persönliche Erfahrung
Das Harvard-IV-Wörterbuch Verzeichnis http://www.wjh.harvard.edu/~inquirer/homecat.htm mindestens zwei Sätze von ready-to-use-Wörterbücher für positive/negative Ausrichtung.
Sie können vader Stimmungs Lexikon
from nltk.sentiment.vader import SentimentIntensityAnalyzer
sentence='APPle is good for health'
sid = SentimentIntensityAnalyzer()
ss = sid.polarity_scores(sentence)
print(ss)
es werden Ihnen die Polarität des Satzes verwenden.
Ausgabe:
{'compound': 0.4404, 'neu': 0.58, 'pos': 0.42, 'neg': 0.0}
- 1. Sentiment-Analyse-Java-Bibliothek
- 2. Einfache Sentiment Analyse
- 3. rapidminer und Sentiment-Analyse
- 4. Sentiment-Analyse mit Tensorflow
- 5. Nicht überwachte Sentiment-Analyse
- 6. TensorFlow Implementierung Seq2seq Sentiment Analyse
- 7. Seed Daten für Sentiment Analyse
- 8. Beschleunigung der CoreNLP-Sentiment-Analyse
- 9. NLTK: Sentiment Analyse und Stemming
- 10. Sentiment-Analyse - Kreuzvalidierung nicht gültig
- 11. Sentiment Analyse in R (nicht mit tm.plugin.tags)
- 12. Twitter Sentiment Analyse Fehlercode: KeyError: 'Text'
- 13. Sentiment-Analyse Python TypeError: erwartete Zeichenfolge oder Bytes-ähnliche Objekt
- 14. Watson/Alchemy Sentiment Analyse falsch als negativ in einigen Fällen
- 15. Sentiment-Analyse mit Python und PHP-Python Nltk
- 16. Sentiment Analyse in Spanisch mit Google Cloud natürliche Sprache api
- 17. Verwenden von Datumbox in Python für die Sentiment-Analyse
- 18. Codebeispiel für Sentiment-Analyse für asiatische Sprachen - Python NLTK
- 19. Sentiment Analyse auf große Sammlung von Online-Konversationstext
- 20. Deeplearning4j: LSTM Beispiel für die Überprüfung Sentiment Analyse
- 21. Verwirrt mit "Sentiment" -Paket in R?
- 22. Stanford CoreNLP sentiment
- 23. Naive Bayes in R, Sentiment-Analyse führt zu Klassenfehler nicht erzwingen
- 24. Echtzeit-Sentiment-Analyse von Twitter Hashtags mit Spark || Fehler beim Starten des Streaming-Dienstes
- 25. Liste der Natural Language Processing-Tools in Bezug auf die Sentiment-Analyse - welches Sie
- 26. Wie Stanford Sentiment Analysis Dataset verwenden
- 27. Confusion Matrix - Test Sentiment Analysis Model
- 28. Sentiment Analysis Klassifizierer mit maschinellem Lernen
- 29. Aussprache Wörterbücher
- 30. Alias-Analyse vs. Zeiger-Analyse vs. Punkte-zu-Analyse
Das Problem ist, dass dieser Ansatz verwendet AltaVista trifft PMI-IR zu berechnen, so dass ich glaube nicht, dass es für jemanden optimal ist, die ersten Schritte will. Darüber hinaus ist es ein unbeaufsichtigter Ansatz und seine Ergebnisse sind im Vergleich zu überwachten Ansätzen immer noch nicht aufregend. –