Dieser reguläre Ausdruck soll Emoticons entfernen, aber wenn ich es an meinem Beispieltext versuche, funktioniert es nicht. Es funktionierte vorher ... nicht sicher, was ich vermisse. DankePython Regulärer Ausdruck Emoticons zu entfernen Funktioniert nicht
Hier ist ein Beispieltext: pastebin.com/uYUNk9R1 Platz in Notepad Dokument zu testen, Python 2.7.
import re
myre = re.compile('('
'\ud83c[\udf00-\udfff]|'
'\ud83d[\udc00-\ude4f\ude80-\udeff]|'
'[\u2600-\u26FF\u2700-\u27BF])+'.decode('unicode_escape'),
re.UNICODE)
def clean(inputFile,outputFile):
with open(inputFile, 'r') as original,open(outputFile, 'w+') as out:
for line in original:
line = myre.sub('', line)
out.write(line)
können Sie das Problem klären Sie haben? – bgarcia
Dadurch werden die Zeilen in stdout gedruckt, aber nicht in die Ausgabedatei geschrieben. Dazu müssen Sie 'out.write' verwenden. –
Entschuldigung, das war mein ursprünglicher Code, aber es hat immer noch nicht funktioniert, @Bgarcia Ich versuche, Emoticons aus einem Stück Text zu entfernen. – Sorry