Ich habe eine Datei, die wie folgt aussieht:Wie entfernt man Zeilenumbrüche innerhalb einer Spalte in einer Datei mit Trennzeichen?
1111,AAAA,aaaa\n
2222,BB\nBB,bbbb\n
3333,CCC\nC,cccc\n
...
Wo \ n eine neue Zeile darstellt.
Wenn ich diese Zeile-für-Zeile lesen, ist sie lesen wie:
1111,AAAA,aaaa\n
2222,BB\n
BB,bbbb\n
3333,CCC\n
C,cccc\n
...
Dies ist eine sehr große Datei ist. Gibt es eine Möglichkeit, eine Zeile bis zu einer bestimmten Anzahl von Trennzeichen zu lesen oder das Zeilenumbruchzeichen in einer Spalte in Python zu entfernen?
Es gibt die rstrip-Methode, wie hier erklärt: http://stackoverflow.com/questions/275018/how-can-i-remove-chomp-a-newline-in-python – westandy
Ein Newline ist der Zeilenbegrenzer von a Datei. Sie haben nicht 3 Zeilen mit je 3 Feldern, Sie haben 5 Zeilen, einige mit drei Feldern und einige mit zwei Feldern. Können Sie die ersten Zeilen Ihrer * tatsächlichen * Datei posten? Ich bin gespannt, ob "BB \ nBB" tatsächlich Zitatzeichen enthält. –
Was sehen Sie, wenn Sie die Datei "cat" (UNIX) oder "type" (Windows) eingeben? Siehst du die Backslash-n-Sequenz oder siehst du Links? –