Ich habe eine Sammlung von Twits und ich möchte Emojis in ihnen überprüfen, aber es sieht aus wie die Schreibprozedur für die Sammlung konvertiert alle Emojis in String zum Beispiel '' ist ':-)' in Text und '' ist ': D' und so weiter mit allen Emojis. Wenn wir versuchen, Unicode-Codepoints für sie zu überprüfen, erhalten wir gleich b':-)'
in der gleichen Zeit entspricht 'b'\xf0\x9f\x98\x8a
und Gleichheitsprüfung fehlschlägt. Unter Verwendung von utf-16
: ':-)'.encode('utf-16')
entspricht b'\xff\xfe:\x00-\x00)\x00'
und ''.encode('utf-16')
ist b'\xff\xfe=\xd8\n\xde'
. Gibt es also eine Möglichkeit, Textdarstellungen wie ":-)" wieder in Emojis umzuwandeln?Konvertiere Strings zu Emoji in Python
2
A
Antwort
2
Verwenden Sie eine dictionary, um Text-Emoticons zurück in Emoji, z. wie folgt:
>>> dict_emo = { ':-)' : b'\xf0\x9f\x98\x8a',
... ':)' : b'\xf0\x9f\x98\x8a',
... '=)' : b'\xf0\x9f\x98\x8a', # Smile or happy
... ':-D' : b'\xf0\x9f\x98\x83',
... ':D' : b'\xf0\x9f\x98\x83',
... '=D' : b'\xf0\x9f\x98\x83', # Big smile
... '>:-(' : b'\xF0\x9F\x98\xA0',
... '>:-o' : b'\xF0\x9F\x98\xA0' # Angry face
... }
>>> print(dict_emo[':)'].decode('utf-8'))
>>> print(dict_emo['>:-('].decode('utf-8'))
>>> print(dict_emo[':-D'].decode('utf-8'))
>>>
>>>
>>> dict_emot= { ':-)' : b'\xf0\x9f\x98\x8a'.decode('utf-8'),
... ':)' : b'\xf0\x9f\x98\x8a'.decode('utf-8'),
... '=)' : b'\xf0\x9f\x98\x8a'.decode('utf-8'), # Smile or happy
... ':-D' : b'\xf0\x9f\x98\x83'.decode('utf-8'),
... ':D' : b'\xf0\x9f\x98\x83'.decode('utf-8'),
... '=D' : b'\xf0\x9f\x98\x83'.decode('utf-8'), # Big smile
... '>:-(' : b'\xF0\x9F\x98\xA0'.decode('utf-8'),
... '>:-o' : b'\xF0\x9F\x98\xA0'.decode('utf-8') # Angry face
... }
>>> print(dict_emot[':)'])
>>> print(dict_emot['>:-o'])
>>> print(dict_emot['=D'])
>>>
Leider gibt es mindestens zwei Aufgaben verbleibenden:
- Text Smiley Faces and Their Meaning weder stabil noch endgültig sind, siehe auch Common examples of emoticons (Computer Definition) und List of emoticons - obwohl es einige Versuche sind eine resource of all the text smileys and emoticons in the world zu schaffen;
- Natural Language Processing: What is an algorithmic way to find all smileys in a text? und wie zu beseitigen (false) Text Emoticons eingebettet wie
:-)
Lächeln in:-))
Doppelkinn.
+0
vielen dank! Es hat sehr geholfen. – UGeorge
Verwandte Themen
- 1. wie man Emoji-Unicode-Strings in Python aufteilen
- 2. Konvertiere Strings in Zahlen mit Dezimalzahl Null und keine Strings
- 3. Konvertiere Strings mit Zeitsuffixen zu Zahlen in numpy
- 4. Unicode Emoji in Python aus CSV-Dateien
- 5. entfernen Unicode Emoji re in Python
- 6. Python schreiben (iPhone) Emoji in eine Datei
- 7. Convert Unicode zu Emoji
- 8. Konvertiere Zeit Dezimal zu Datetime-Objekt Python
- 9. Wie konvertiere ich Strings Mehrdimensionen Wörterbuch
- 10. In Emoji
- 11. Gruppierung großer Textdaten in Bezug auf Emoji in Python
- 12. Python mehrere Strings zu Tupeln
- 13. Strings in Python listet
- 14. Wie konvertiere ich nur bestimmte Teile eines Strings in Python in Großbuchstaben?
- 15. Muting Strings in Python
- 16. Splitting-Strings in Python
- 17. Drucken Python Emoji als Unicode-String
- 18. Konvertiere Zeichenkette in Bild in Python
- 19. Python - Lesen von Emoji-Unicode-Zeichen
- 20. Wie konvertiere ich diese Liste in ein paar Strings?
- 21. Python Unicode-Zeichen-Konvertierung für Emoji
- 22. Emoji in mysql dreht sich zu Fragezeichen
- 23. Wie konvertiere ich die Liste der Strings in Doppel?
- 24. Konvertiere alle Elemente eines Arrays in einzelne Strings
- 25. Umwandlung von 6-Byte-Emoji zu 4-Byte-Emoji und in der Lage, es zu lesen
- 26. Wie konvertiere ich von Zeitstempel zu Datum in Python?
- 27. konvertiere string zu dict mit list Verständnis in Python
- 28. Paketname Konflikt zwischen `Emoji` und` Django-Emoji`
- 29. Python: Konvertiere eine Zeichenkette in eine Ganzzahl
- 30. Python Anfrage konvertiere Zeichenfolge in JSON
Das erste, was ich tun würde, ist es mit Regex zu suchen. – Gabriel