Ich versuche einen WhatsApp-Chat-Text in einzelne Wörter zu teilen, aber ich weiß nicht, wie man den Unicode der Emojis als zusätzliche Trennzeichen verwendet.Python: Text mit Emojis als Trennzeichen teilen
Nach http://unicode.org/emoji/charts/full-emoji-list.html wäre ein Beispiel Unicode U + 1F602. Ich habe Folgendes versucht, aber es funktioniert nicht.
text = file.read()
delimiters = " ", "..", "\"", "<", ">", "/", u"U+1F602"
regexPattern = '|'.join(map(re.escape, delimiters))
list = re.split(regexPattern, text)
Welche Python-Version? Definieren funktioniert nicht. Hier (python2.7.11 +) funktionierte dieses Snippet (https://gist.github.com/lauromoura/f46442e25d1e08519af4aaef972cad3b) gut und teilte alle Buchstaben auf. Vielleicht etwas im Zusammenhang mit der Eingabezeichenfolge? –
ok, ich benutze Python 2.7.10, vielleicht deshalb funktioniert es nicht. – Philip94
Ich versuche es zu beheben – Philip94