Ich versuche, eine Liste von E-Mails aus einem bestimmten Text zu extrahieren. Die meisten E-Mails hat die folgende Syntax:E-Mails aus einem bestimmten Text extrahieren
"Last_name, First_Name (First-name)" <[email protected]>
or
"Last_name, First_Name (XXXX)" <[email protected]>
Mein Ziel ist es, die gesamte E-Mails, die den ersten Teil zu extrahieren, das heißt die „Last_name, First_Name (XXXX)“.
die Liste der E-Mails zu extrahieren, habe ich die folgende regex verwendet:
"(<?[a-z0-9!#$%&*+\/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+\/=?^_`"
"{|}~-]+)*(@|\sat\s)(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?(\.|"
"\sdot\s))+[a-z0-9](?:[a-z0-9-]*[a-z0-9]>?)?)"
, die nur die E-Mails ohne den ersten Teil zu extrahieren. Was bedeutet, dass Extrakt nur das:
<[email protected]>
Ich habe mehrere Varianten der regex versucht, den ersten Teil zu extrahieren, aber leider ist sie nicht.
Bitte zögern Sie nicht, wenn Sie einen Vorschlag haben. Vielen Dank im Voraus.
Sind die E-Mail-Strings in '<...>' gespeichert? Wenn ja, extrahiere einfach '<.*?>'? –
Haben Sie Beispiel-E-Mails, aus denen die E-Mail-Informationen extrahiert werden sollen? Wenn ja, posten Sie hier die vollständige Eingabe und lassen Sie uns genau wissen, wie die Ausgabe aussehen soll (unter Annahme mehrerer Eingaben, da es scheinbar mehrere Formate gibt). Versuchen Sie auch, Gruppen zu erfassen? Möchtest du den Vornamen, den Nachnamen und die E-Mail Adresse? Und in welchem Format willst du das letztere? – ctwheels