Ich arbeite an einem Code mit Python, um die Erwähnungen aus einem Tweet-Text zu extrahieren.Wie verwendet man Python, um die Erwähnungen zu extrahieren?
Der Parameter ist ein Tweet-Text. Diese Funktion sollte eine Liste mit allen Erwähnungen im Tweet in der Reihenfolge zurückgeben, in der sie im Tweet erscheinen. Jede Erwähnung in der zurückgegebenen Liste sollte die anfängliche Erwähnung Symbol entfernt haben, und die Liste sollte jede Erwähnung angetroffen enthalten - einschließlich Wiederholungen, wenn ein Benutzer mehr als einmal innerhalb eines tweet.Here sind zwei Beispiele erwähnt wird:
>>>extract_mentions('@AndreaTantaros- You are a true journalistic\
professional. I so agree with what you say. Keep up the great\
[email protected] ')
['AndreaTantaros','RepJohnLewis']
>>>extract_mentions('@CPAC For all the closet #libertarians attending \
#CPAC2016 , I'll be there Thurs/Fri -- speaking Thurs. a.m. on the main\
stage. Look me up! @CPAC')
['CPAC','CPAC']
Eine Erwähnung beginnt mit dem Symbol "@" und enthält alle alphanumerischen Zeichen bis zu einem Leerzeichen, Satzzeichen oder dem Ende eines Tweets.
Wie kann ich die Erwähnungen aus der Zeichenfolge extrahieren? Tut mir leid, ich habe noch nichts über Regex gelernt, gibt es noch andere Möglichkeiten?
was ist, wenn die E-Mail-Adresse eines anderen - [email protected] ?? –
Das hängt davon ab, dass Sie einfach eine Regex haben können, die genau drei Zeichen nach einem '.' Entspricht: '[\ w] + @ [\ w] + \. [A-z] {3}'. Es hat vom OP nicht genau gesagt, was sie will. @WasiAhmad – Jarvis
Was ist, wenn meine E-Mail-Adresse 'Hallo @ example.ninja' ist? Oder 'Hallo @ Beispiel.nl'? Oder 'Hallo.there @ example.com'? Oder 'Hallo + dort @ example.com'? – Carpetsmoker