zu ignorieren Ich habe eine Regex, um eine URL wie http://www.test.com
innerhalb body
zu erhalten, die der Inhalt einer E-Mail ist.Python - Regex alles in <>
Allerdings kann es auch URLs in diesem Format sein: <http://www.test.com>
Ich versuche, den folgenden regulären Ausdruck zu bearbeiten alles innerhalb dieser Symbole <>
url = re.search('http[s]?://(?:[a-zA-Z]|[0-9]|[[email protected]&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', body)
Es könnte einfacher sein, Regex dafür nicht zu verwenden. – khelwood
Was wäre Ihre Alternative? Ich dachte, dass ich vielleicht versuchen würde, alles innerhalb von <> zu entfernen, bevor ich die Zeichenfolge in den regulären Ausdruck übertrage. – dperrie
Dies kann mit einem sehr, sehr einfachen Wechsel erfolgen. Suche nach "regex lookarounds". Oder nur Regex-Tutorials im Allgemeinen. Deine Regex ist überkompliziert und redundant und hat mit ziemlicher Sicherheit einen Fehler, den du nicht bemerkt hast (Tipp: Das '-' in' [$ -_ @. & +] ') –