Ich muss Benutzernamen und IDs aus einer sehr großen Datei extrahieren. Ich benutze Python 2.7. Ich muss alles drucken, das nach username = oder prId = kommt und mit Anführungszeichen "" ist.Python Regex Muster passend
Eingang:
1. username="null null”
2. username="test"
3. username="test name"
4. username="<unknown>"
5. prId="tokenKeyUser"
Die unten sollte angepasst werden:
null null
test
test name
<unknown>
tokenKeyUser
Zur Zeit mache ich die folgenden:
re.search(r'username="(.*?)"', line)
re.search(r'prId="(.*?)"', line)
all dies ist in der Lage zu finden Muster außer Linie 1 und Linie 5.
Es ist nicht in der Lage zu finden: 1. „null null“ 2. ‚tokenKeyUser‘
Was mache ich hier falsch tun
Zeile 1 scheint ein intelligentes Zitat zu haben, das den zitierten Teilstring beendet. – DavidO
in der ersten Zeile sehe ich zwei verschiedene Zeichen '' und '" ' – furas
... und der zweite passt für mich. Kann den Spielfehler nicht reproduzieren. – DavidO