Bisher, als ich versuchte, Emoji zu verwenden und den POS-Tagger zu verwenden, erschien es als unbekannte Symbole, kleine Kästchen. Gibt es eine Möglichkeit, den POS-Tagger mit Emoji arbeiten zu lassen? Emoji wie in den Unicode-Versionen.Stanford CoreNLP und Emoji?
Antwort
Vorausgesetzt, dass die Zeichencodierung im gesamten Code, System und dem Stanford CoreNLP-Code korrekt ist, sollte Emoji korrekt dargestellt werden. Allerdings haben Sie zwei grundlegendere Probleme:
Erstens, Emoji sind ein Zeichen lang und sie sind unwahrscheinlich, als etwas anderes als ein unbestimmter Artikel markiert werden. 'a' auf Englisch. Ein intelligenter Tokenizer könnte einen besseren Sinn für Emoji haben, aber ich bezweifle es.
Zweitens, und noch wichtiger, POS-Tagger kommentieren parts of speech. Emoji sind kein Teil der Rede. Zumindest sind sie eine unabhängige, neue Klasse von Tokens, aber sicher nicht grammatikalisch.
All das sagte ... Sie kennen ihre Zeichencodes ... sie sind bereits markiert.
Ab Version 3.8.0 unterstützt Stanford CoreNLP Emojis.
Was bedeutet es durch Unterstützung Emojis? Ich habe dieses Problem: https://stackoverflow.com/questions/46905716/stanford-chinese-segment-dont-handle-emojis-well – user697911
- 1. stanford corenlp Serialisierung Ausnahme
- 2. Stanford corenlp Gefühl Trainingssatz
- 3. Stanford CoreNLP OpenIE Annotator
- 4. Stanford NLP CoreNLP .NET
- 5. Stanford CoreNLP sentiment
- 6. Maven Build für Stanford CoreNLP und Stanford Parser
- 7. Stanford CoreNLP Entfernen NUMBER Einheit
- 8. Stanford CoreNLP Annotatoren Gewinde sicher?
- 9. Stanford CoreNLP BasicPipelineBeispiel funktioniert nicht
- 10. Server Stanford CoreNLP Lauf multithreadedly
- 11. Stanford CoreNLP Python-Schnittstelle Installationsfehler
- 12. wie man openie von stanford-corenlp verwendet ohne lemma von stanford-corenlp zu verwenden?
- 13. Stanford CoreNLP - Test-Befehl mit Conll-Ausgabe
- 14. Wie importierte NER zu Stanford CoreNLP?
- 15. Set Optionen in Stanford CoreNLP Tokenizer
- 16. Stanford CoreNLP: Verbesserte ++ Abhängigkeiten Erkennung in Java
- 17. Stanford CORENLP Meister Halten Crashing (Nullpointer)
- 18. Shallow Parsing vs Tief Parsing in Stanford CoreNLP (Java)
- 19. Stanford CoreNLP tokenize.whitespace Eigenschaft funktioniert nicht auf Chinesisch
- 20. Stanford CoreNLP Wie bekomme ich IndexedWord von CoreLabel?
- 21. Coreference-Auflösung in Python nltk mit Stanford coreNLP
- 22. Verwenden von Stanford Parser (CoreNLP), um Satzköpfe zu finden
- 23. Extrahieren der Beziehung zwischen Entitäten in Stanford CoreNLP
- 24. Wie kann ich stanford coreNLP spanische Modell/Wörterbuch
- 25. Stanford CoreNLP - So richten Sie eine andere Sprache ein
- 26. Scala - Spark-corenlp - java.lang.NoClassDefFoundError
- 27. Die Stanford CoreNLP liefert mehr als dreifache Beziehungstripel
- 28. Stanford CoreNLP: -threads Flag verursacht alle ner Werte
- 29. Wikipedia-Objekt Annotator funktioniert nicht in Stanford coreNLP
- 30. Stanford CoreNLP mit Chinesisch auf Spark Fehler: Unbekannte Sprache UniversalChinese
Wenn sie als Kästchen zeigt, stehen die Chancen sind die Codierung ist nicht das Gleiche. Nur eine Vermutung. – Qix
Und irgendwo zwischen dem Original und dem Ausgangsterminal könnte der Schuldige sein. – gerowam
Sehr wahr./length – Qix