Ich versuche URLs und @username Erwähnungen von twitter Daten zu ersetzen, indem ich regulären Ausdruck von Python und eine for-Schleife benutze.Wie for for loop und regex verwenden, um Elemente einer Liste zu ändern
d = df['text']
for i, e in enumerate(d):
d[i] = re.sub('((www.\.[\s]+)|(https?://[^\s]+))','URL', e)
d[i] = re.sub('@[^\s]+', 'AT_USER', e)
Das Problem ist, dass die für die Schleife nur für die zweite Zeile des regulären Ausdruck Code funktioniert (‚AT_USER‘). Ich möchte die URL UND @ username Erwähnungen ersetzen. Ich dachte daran, zwei getrennte Schleifen für jeden zu machen, aber sicherlich gibt es einen effektiveren Weg?
'd [i] = re ('@ [^ \ s] +', 'AT_USER', e)' => 'd [i] = re ('@ [^ \ s] +', 'AT_USER', d [i]) 'oder deine erste Zeile hat keine Wirkung –
Warum benutzt du Pand? wie und nicht mit 'str.replace'? –