Ich habe mehrere der Stack Overflow Beiträge mit ähnlichen Titeln angesehen, und keine der akzeptierten Antworten haben den Trick für mich getan.Match unescaped Zitate in zitierten csv
Ich habe eine CSV-Datei, in der jede "Zelle" von Daten durch ein Komma getrennt ist und zitiert wird (einschließlich Zahlen). Jede Zeile endet mit einem neuen Zeilenzeichen.
Einige Text "Zellen" haben Anführungszeichen in ihnen, und ich möchte Regex verwenden, um diese zu finden, so dass ich ihnen richtig entkommen kann.
Beispiel Linie:
"0","0.23432","234.232342","data here dsfsd hfsdf","3/1/2016",,"etc","E 60"","AD"8"\n
Ich möchte passen nur die "
in E 60"
und in AD"8
, aber keine der anderen "
.
Was ist ein (vorzugsweise Python-freundlicher) regulärer Ausdruck, den ich dafür verwenden kann?
*** https: //regex101.com/r/VxEXf2/3*** – 0m3r
Vielen Dank für die Antwort! Das ist knapp, aber ich möchte nur diese internen Anführungszeichen anpassen, damit ich sie ersetzen kann (ich will zum Beispiel nicht den Teil "E 60" ersetzen. Ich denke, ich brauche auch den Rest der Zeichenkette) etwas flexibler als die Beschränkung auf einzelne Zahlen und Buchstaben in den anderen Strings (siehe aktuelles Original-Post-Beispiel) – sundance
Können Sie das gewünschte Match auch aktualisieren – 0m3r