2010-05-17 9 views
7

ich eine Datei wie diese:Spiel über mehrere Zeilen Perl regular expression

01 00 01 14 c0 00 01 10 01 00 00 16 00 00 00 64 
00 00 00 65 00 00 01 07 40 00 00 22 68 61 6c 2e 
6f 70 65 6e 65 74 2e 63 6f 6d 3b 30 30 30 30 30 
30 30 30 32 3b 30 00 00 00 00 01 08 40 00 00 1e 
68 61 6c 2e 6f 70 65 6e 65 74 2d 74 65 6c 65 63 
6f 6d 2e 6c 61 6e 00 00 00 00 01 28 40 00 00 21 
72 65 61 6c 6d 31 2e 6f 70 65 6e 65 74 2d 74 65 
6c 65 63 6f 6d 2e 6c 61 6e 00 00 00 00 00 01 25 
40 00 00 1e 68 61 6c 2e 6f 70 65 6e 65 74 2d 74 
65 6c 65 63 6f 6d 2e 6c 61 6e 00 00 00 00 01 1b 
40 00 00 20 72 65 61 6c 6d 2e 6f 70 65 6e 65 74 
2d 74 65 6c 65 63 6f 6d 2e 6c 61 6e 00 00 01 02 
40 00 00 0c 01 00 00 16 00 00 01 a0 40 00 00 0c 
00 00 00 01 00 00 01 9f 40 00 00 0c 00 00 00 00 
00 00 01 16 40 00 00 0c 00 00 00 00 00 00 01 bb 
40 00 00 28 00 00 01 c2 40 00 00 0c 00 00 00 00 
00 00 01 bc 40 00 00 13 31 39 37 37 31 31 31 32 
32 33 31 00 

ich die Datei lese und dann bestimmtes Oktetts zu finden und sie mit Tags zu ersetzen:

while(<FH>){ 
    $line =~ s/(00 00 00 64)/<incr4> /g; 
    $line =~ s/(00 00 00 65)/<incr4> /g; 
    $line =~ s/(30 30 30 30 30 32)/<incr6ascii:999999:0>/g; 
    $line =~ s/(31 31 32 32 33 31)/<incr6ascii:999999:0>/g; 
    print OUTPUT $line; 
} 

So zum Beispiel , 00 00 00 64 würde durch den Tag <incr4> ersetzt werden. Das funktionierte gut, aber es scheint nicht mehr in der Lage zu sein, mehrere Zeilen zu kombinieren. Zum Beispiel läuft das Muster 31 31 32 32 33 31 über mehrere Zeilen, und der reguläre Ausdruck scheint es nicht zu fangen. Ich habe versucht,/m/s Mustermodifikatoren zu verwenden, um neue Zeilen zu ignorieren, aber sie haben es auch nicht übereingestimmt. Der einzige Weg, um es mich mit oben kommen kann, ist die gesamte Datei in einen String zu lesen, mit:

undef $/; 
my $whole_file = <FH>; 
my $line = $whole_file; 
$line =~ s/(00 00 00 64)/<incr4> /g; 
$line =~ s/(00 00 00 65)/<incr4> /g; 
$line =~ s/(30 30 30 30 30 32)/<incr6ascii:999999:0>/g; 
$line =~ s/(31 31 32 32 33 31)/<incr6ascii:999999:0>/g; 
print OUTPUT $line; 

Dies funktioniert, die Tags richtig eingesetzt, aber die Struktur der Datei wird radikal verändert. Es ist alles in einer einzigen Zeile ausgegeben. Ich möchte die Struktur der Datei beibehalten, wie sie hier erscheint. Irgendwelche Ideen, wie ich das machen könnte?

/john

Antwort

4

Die hier Trick ist, die Klasse aller Raum wie Zeichen übereinstimmen \s:

my $file = do {local (@ARGV, $/) = 'filename.txt'; <>}; # slurp file 

my %tr = ( # setup a translation table 
    '00 00 00 64'  => '<incr4>', 
    '00 00 00 65'  => '<incr4>', 
    '00 30 30 30 30 32' => '<incr6ascii:999999:0>', 
    '31 31 32 32 33 31' => '<incr6ascii:999999:0>', 
); 

for (keys %tr) { 
    my $re = join '\s+' => split; # construct new regex 

    $file =~ s{($re)}{ 
     $1 =~ /\n/ ? "\n$tr{$_}" : $tr{$_} # if octets contained \n, add \n 
    }ge # match multiple times, execute the replacement block as perl code 
} 
print $file; 
+0

Excellent! Funktioniert perfekt ... Ich habe nie daran gedacht, eine Hash-Karte zu verwenden, geniale Lösung! – John

+1

+1: Tolle Lösung, nur am Ende den '/ x' Modifikator einstecken! – Zaid