Sed: Extrahieren RegexMuster aus Linien

ich einen Eingangsstrom von vielen Linien haben, die wie folgt aussehen:Sed: Extrahieren RegexMuster aus Linien

path/to/file:    example: 'extract_me.proto' 
path/to/other-file:    example: 'me_too.proto' 
path/to/something/else:    example: 'and_me_2.proto' 
...

Ich mag würde, nur die *.proto Dateinamen aus diesen Linien zu extrahieren, und ich habe versucht:

[INPUT] | sed 's/^.*\([a-zA-Z0-9_]+\.proto\).*$/\1/'

ich, dass ein Teil meines Problems wissen ist, dass .* gierig ist und ich werde Dinge wie e.proto und o.proto und 2.proto bekommen, aber ich kann auch nicht so weit kommen ... es gibt nur mit der gleiche Linien wie th e Eingabe. Jede Hilfe würde sehr geschätzt werden.

Quelle

2016-11-07 AndyPerlitch

Vielen Dank für jede Antwort! Ich habe nicht so viel Hilfe auf einmal erwartet ... Ich wünschte, ich könnte sie alle akzeptieren – AndyPerlitch

Ich finde es hilfreich, erweiterte Regex für diesen Zweck zu verwenden (-r) in diesem Fall müssen Sie nicht Ihre Klammern entkommen.

sed -r 's/^.*[^a-zA-Z0-9_]([a-zA-Z0-9_]+\.proto).*$/\1/'

Die Zugabe von [^a-zA-Z0-9_] zwingt die .* nicht gierig zu sein.

Quelle

2016-11-07 18:20:24

ein Weg, es zu tun:

sed 's/^.*[^a-zA-Z0-9_]\([a-zA-Z0-9_]\+\.proto\).*$/\1/'

entkam den + char
eine Negation vor dem alphanum setzen + unterstreichen die führenden Zeichen

eine andere Art und Weise zu begrenzen: verwenden Single Zitat Abgrenzung, schließlich ist es hier dafür:

sed "s/^.*'\([a-zA-Z0-9_]\+\.proto\)'.*\$/\1/"

Quelle

2016-11-07 18:20:13

verwenden sed:

sed "s/^.*'\([a-zA-Z0-9_]\+\.proto\).*$/\1/"

+ - Extended-RegEx. Also musst du entkommen, um eine besondere Bedeutung zu bekommen. The preceding item will be matched one or more times.

Ein anderer Weg:

sed "s/^.*'\([^']\+\.proto\)'.*$/\1/"

Quelle

2016-11-07 18:21:17 sat

Da Sie mit linux Ihren Befehl Tag, ich nehme an, Sie GNU grep haben. Wählen Sie eine von

grep -oP '\w+\.proto' file 
grep -o "[^']+\\.proto" file

Quelle

2016-11-07 18:24:50

Mit GNU sed:

sed -E "s/.*'([^']+)'$/\1/"

Quelle

2016-11-07 18:29:32 Cyrus

Sed: Extrahieren RegexMuster aus Linien

Antwort

Verwandte Themen