Ich habe eine Protokolldatei, die etwa 1,5 GB ist. Die Datei enthält Protokolldaten in folgendem Format:Parsing Log-Datei in Python und Speichern in Csv
A|B|C|D delimited by '|' character and does not have column names. It has only
four columns
Wie kann ich es analysieren 3.6 Python und es dann exportieren Datei in CSV und benutzerdefinierte Spaltennamen hinzuzufügen. Wie begrenzen Sie die Anzahl der Zeilen beim Exportieren in CSV-Datei.
Ich habe begonnen, wie unten den Code zu schreiben, aber nicht wissen, wie weiter verfahren ist:
import re
import pandas as pd
from pandas import ExcelWriter
infile = r"D:\Sys\file.log"
df = pd.DataFrame()
with open(infile,encoding="ISO-8859-1") as f:
f = f.readlines()
for line in f:
print(line)
Ich bin in der Lage, die Linien zu bekommen, wie ich es mit print-Anweisung überprüft.
Kann diese Spalten * auch möglicherweise haben '|' in ihnen? Wenn nicht, können Sie einfach auf dieses Trennzeichen aufteilen. –
Keine Zeilen haben kein "|" Trennzeichen. Wie man Trennzeichen verwendet und in CSV speichert –
Okay, und was willst du mit Pandas machen? –