Ich habe einen Daten-Dump, der eine "versaute" CSV ist. (Etwa 100 Dateien mit jeweils etwa 1000 Zeilen tatsächlicher CSV-Daten.)
Der Dump enthält neben CSV noch einen anderen Text. Wie kann ich den CSV-Teil programmatisch extrahieren?identifizieren csv in Python
Als Beispiel wird die Datendatei sieht aus wie so etwas wie dieses
Session:1
Data collection date: 09-09-2016
Related questions:
Question 1: parta, partb, partc,
Question 2: parta, partb, partc
"field1","field2","field3","field4"
"data11","data12","data13","data14"
"data21","data22","data23","data24"
"data31","data32","data33","data34"
"data41","data42","data43","data44"
"data51","data52","data53","data54"
Ich brauche den csv Teil zu extrahieren.
Vorbehalte,
Der Text am Anfang ist nicht auf 4 bis 5 Zeilen begrenzt.
der zusätzliche Text ist nicht nur am Anfang der Datei
ich this post sah die re.split und/oder csv.Sniffer, aber mein Versuch nicht erfolgreich war schlägt mit.
Für jetzt bin ich in der Lage, die csv Linien genau zu identifizieren, nur wenn es eine Reihe von Daten gibt.
Gibt es etwas besseres, was ich tun kann?
Was trennt dann die Zeilen mit Daten und Zeilen mit Text? Kann eine Textzeile mit "? – Aidenhjj
also, das ist, wo das Problem liegt, gibt es nichts, das CSV-Daten vom Text trennt, es sei denn, Sie leere Zeilen als Trennzeichen betrachten. – okkhoy