2017-10-30 6 views
1

Ich versuche die Zahlen zu extrahieren, die nach "segment1", "segment2" usw. folgen. Zum Beispiel Muster NS1: segment1> 307000. Ich möchte nur die 307000 haben. Ich kann nicht eine einfache Möglichkeit, Regex in Notepad ++ zu verwenden, da ich noch lerne. Unten ist ein Beispiel von, was ich möchte:Notepad ++ Regex Informationen extrahieren

/NS1:salesCredits 
    NS1:distributions 
    NS1:interfaceLineContext>TS</NS1:interfaceLineContext 
    NS1:interfaceLineAttributes 
    NS1:interfaceLineAttribute1>11111</NS1:interfaceLineAttribute1 
    NS1:interfaceLineAttribute2>TSO</NS1:interfaceLineAttribute2 
    NS1:interfaceLineAttribute3>TSO1234</NS1:interfaceLineAttribute3 
    NS1:interfaceLineAttribute4>12345678</NS1:interfaceLineAttribute4 
    /NS1:interfaceLineAttributes 
    NS1:attribute1/ 
    NS1:accountClass>REV</NS1:accountClass 
    NS1:amount>0.00</NS1:amount 
    NS1:orgId>103</NS1:orgId 
    NS1:percent>0</NS1:percent 
    NS1:segments 
    NS1:segment1>307000</NS1:segment1 
    NS1:segment2>460075</NS1:segment2 
    NS1:segment3>0000</NS1:segment3 
    NS1:segment4>321000</NS1:segment4 
    NS1:segment5>32181</NS1:segment5 
    NS1:segment6>000000</NS1:segment6 
    NS1:segment7>00000</NS1:segment7 
    /NS1:segments 
    /NS1:distributions 
    NS1:distributions 
    NS1:interfaceLineContext>TS</NS1:interfaceLineContext 
    NS1:interfaceLineAttributes 
    NS1:interfaceLineAttribute1>104009</NS1:interfaceLineAttribute1 
    NS1:interfaceLineAttribute2>TS</NS1:interfaceLineAttribute2 
    NS1:interfaceLineAttribute3>TS45678</NS1:interfaceLineAttribute3 
    NS1:interfaceLineAttribute4>9875412</NS1:interfaceLineAttribute4 
    /NS1:interfaceLineAttributes 
    NS1:attribute1/ 

Jede Hilfe würde geschätzt werden, um diese Informationen zu extrahieren.

Antwort

1

In Notepad ++ zu ersetzen, drücken Sie Ctrl + H das Ersetzen-Menü zu öffnen.

Suche: \s+NS1:segment\d+>(\d+).*|.*

ersetzen: $1

Wenn $1 funktioniert nicht mit \1 versuchen.

Zuerst es für NS1:segment\d+>(\d+).*

das Spiel zwischen den Klammern überprüfen, genannt Capture groups wird zu $ ​​1 zugewiesen werden, da es das erste Spiel ist.

Wenn es keine Übereinstimmung ist, wird es auf .* überprüfen, die alles entspricht und somit alle anderen Zeilen durch nichts ersetzt.

Mit dem Proben Sie es zur Verfügung gestellt werden Sie mit:

307000 
460075 
0000 
00 
32181 
000000 
00000