2015-03-21 13 views
5

Ich habe eine große Datei, die Zeilen sehen so aus Text-Nummern usw. [Man- (einige Numers)] ist viel von diesem Man-somenumbers ist in wenigen Zeilen wiederholen, ich will nur einzigartige Man-Wörter zählen. Ich kann keine eindeutige Datei verwenden, weil Text vor Man-Wörtern in jeder Zeile immer anders ist. Wie kann ich nur eindeutige Man-somenumbers Wörter in Datei zählen?So finden Sie eindeutige Wörter aus der Datei linux

+0

Eine Kombination von 'Grep' und' WC' oder 'LC' sollte ein guter Anfang sein. – arkascha

Antwort

6

Wenn ich verstehe, was Sie richtig machen wollen, dann

grep -oE 'Man-[0-9]+' filename | sort | uniq -c 

sollte es tun. Es funktioniert wie folgt: Zunächst

grep -oE 'Man-[0-9]+' filename 

alle Wörter aus der Datei-Isolaten, die den Man-[0-9]+ regulären Ausdruck übereinstimmen. Diese Liste wird dann durch sort geleitet, um die sortierte Liste zu erhalten, die uniq erfordert, und dann wird diese sortierte Liste durch uniq -c geleitet, um zu zählen, wie oft jedes eindeutige Man- Wort erscheint.

+0

Es funktionierte auch ohne -O Option. Bei Verwendung der Option -o wurde eine ungültige Option angegeben. Ich benutze Windows und benutze die Befehle in GIT BASH von der GIT-Installation. –

Verwandte Themen