Zeilen aus Datei entfernen

Ich mache einige Textverarbeitung auf einem Unix-System. Ich habe Zugriff auf die Kommandozeile auf dieser Maschine und Python, Perl und die Standard-Textverarbeitung progams installiert, awk usw.Zeilen aus Datei entfernen

ich eine Textdatei, die wie unten aussieht:

2029754527851451717 
2029754527851451717 
2029754527851451717 
2029754527851451717 
2029754527851451717 
2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009 
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009 
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009 
2895635937120524206 
2895635937120524206 
2895635937120524206 
2895635937120524206 
2895635937120524206 
2895635937120524206 
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009

Es ist im Grunde 3 Zeilen: ID ID Datum

Ich suche alle Zeilen zu entfernen, die nicht 2 IDs und ein Datum haben. Die Ergebnisse werden also wie folgt aussehen:

2029754527851451717 1232453488239 Tue Mar 3 10:47:44 2009 
2029754527851451717 1232453488302 Tue Mar 3 10:47:44 2009 
2029754527851451717 1232453488365 Tue Mar 3 10:47:44 2009 
5622983575622325494 1232453323986 Thu Feb 12 15:57:49 2009

Wie würden Sie vorschlagen, dies zu tun? Insgesamt ist die Textdatei etwa 30.000 Zeilen lang.

Prost

Eef

Quelle

2009-04-27 RailsSon

Mit awk:

awk 'NF > 2' input_file > output_file

Quelle

2009-04-27 14:43:13

das Äquivalent perl ist: perl -i -wane'print wenn @F> 6 'eingabedatei> ausgabedatei – ysth

Mit Python:

file = open(filename, 'r') 
lines = file.readlines() 
file.close() 

p = re.compile('^\d*$') 

for line in lines: 
    if not p.search(line): print line,

Quelle

2009-04-27 14:37:36 kgiannakakis

Sie wahrscheinlich in einer ganzen 30000 Zeilendatei nicht lesen wollen. – chills42

@ chills42: das ist dinky. Max 60 Bytes pro Zeile ergibt 1.7Mb. – ysth

with open(source_filename) as src: 
    with open(dest_filename, 'w') as dst: 
     for line in src: 
      if len(line.split()) > 1: 
       dst.write(line)

Quelle

2009-04-27 14:42:29

Mit Perl:

perl -ne 'print if /^([0-9]+\s+){2}.+$/' $filename

Quelle

2009-04-27 14:43:53 dsm

-1

sed '/^[0-9]$/d' filename

(könnte das Muster ändern, wenn die schlechten Linien Leerzeichen haben). Sie können auch grep -v verwenden, wodurch das übereinstimmende Muster ausgelassen wird.

Quelle

2009-04-27 14:44:24

awk "NF>1" < filename

Quelle

2009-04-27 14:47:22

grep ':' filename

Quelle

2009-04-27 14:49:24

wow, ein genius touch! – fengshaun

arbeiten Nur mein Perl hier, aber dies könnte auch helfen:

perl -lane 'if (scalar(@F) == 3) { print @F;}' file >> file.out

Quelle

2009-04-27 15:06:35 hyperboreean

nutzloser Gebrauch der Katze. – hillu

True, jetzt bearbeitet. Danke Hillu. – hyperboreean

sollte das nicht "skalar (@F)> 3" sein? – dsm

perl -i -lane 'print if($F[1])' file

Quelle

2013-08-08 10:36:10 Vijay

Zeilen aus Datei entfernen

Antwort

Verwandte Themen