Ich frage mich, ob es eine Möglichkeit gibt, Unix-Textdateien schneller miteinander zu verketten als cat
läuft?Was ist der schnellste Weg, mehrere Dateien zu catchen?
Hier ist das Problem, mit dem ich konfrontiert bin. Ich bin String Verarbeitung einer Textdatei ~ 100G in Größe. Ich versuche, die Laufzeit zu verbessern, indem ich die Datei in mehrere hundert kleinere Dateien zerlege und parallel verarbeite. Am Ende ziehe ich die resultierenden Dateien wieder zusammen. Die Lese-/Schreibzeit der Datei selbst nimmt Stunden in Anspruch. Ich mag einen Weg finden, den folgenden Bereiche zu verbessern:
cat file1 file2 file3 ... fileN >> newBigFile
Dies erfordert die doppelten Festplattenspeicher als
file1
...fileN
nimmt 100G und dannnewBigFile
nimmt eine anderen 100Gb und dannfile1
. ..fileN
bekommtDie Daten sind bereits in
zu Hunderte von Dateien benötigen, istfile1
entfernt ...fileN
lesen diecat >>
erleidet und tun und Zeit schreiben, wenn alles, was ich wirklich für die wieder erscheinen als 1 Datei ...
Es klingt wie Sie etwas mit ein bisschen mehr Muskeln als ein Unix-Shell werden sollte. –
Ich habe keine Ahnung, wovon ich spreche, aber ist es möglich, die Datei zu manipulieren oder so etwas? Was ich tun musste, war nicht, Daten zu duplizieren, sondern mehrere Dateien zusammen wieder in 1 zu zeichnen? – Wing