Zählen alle Vorkommen einer Zeichenfolge in vielen Dateien mit grep

225

Ich habe eine Reihe von Protokolldateien. Ich muss herausfinden, wie oft eine Zeichenfolge in allen Dateien auftritt.Zählen alle Vorkommen einer Zeichenfolge in vielen Dateien mit grep

grep -c string *

kehrt

... 
file1:1 
file2:0 
file3:0 
...

ein Rohr konnte ich verwenden nur Dateien zu erhalten, die ein oder mehrere Vorkommen haben:

grep -c string * | grep -v :0 

... 
file4:5 
file5:1 
file6:2 
...

Wie ich nur die kombinierte Zählung zu bekommen? (Wenn es file4:5, file5:1, file6:2 zurückgibt, möchte ich zurück 8.)

Quelle

2008-12-16 Željko Filipin

Können Sie mir sagen, was das grep -v: 0 tut? . Ich weiß, dass es für Dateien mit Vorkommen größer als 0 zählt. Was bedeutet die Option -v und: 0? Bitte lass es mich wissen. –

@GauthamHonnavara grep: 0 sucht nach einer Zeile, die mit der Zeichenfolge übereinstimmt: 0. -v ist eine Option, um diese Suche zu invertieren, stattdessen mit grep -v: 0 bedeutet, dass alle Zeilen gefunden werden, die nicht enthalten: 0 also würde eine Zeile mit Datei4: 5 und Datei27: 193 alle durchlaufen, da sie nicht enthalten: 0 – penguin359

230

cat * | grep -c string

Quelle

2008-12-16 12:17:21 Bombe

Dies hat die gleiche Einschränkung, dass es mehrere Vorkommen in einer Zeile nur einmal zählt. Ich vermute, dass dieses Verhalten in diesem Fall in Ordnung ist. –

@Michael Haren Ja, es könnte nur ein Vorkommen von String in einer Zeile sein. –

Ich würde lieber 'grep -c string <*' Also nur den Platz mit einem weniger als ersetzen. –

Anstelle von -c, nur Rohr es nach wc-l.

grep string * | wc -l

Dies wird jedes Vorkommnis in einer einzigen Zeile auflisten und dann die Anzahl der Zeilen zählen.

Dies wird Instanzen vermissen, in denen die Zeichenfolge 2+ Mal in einer Zeile auftritt.

Quelle

2008-12-16 12:15:58

Piping zu "wc -l" funktioniert auch gut zusammen mit "grep -r 'test'." die rekursiv alle Dateien für die Zeichenfolge 'test' in allen Verzeichnissen unterhalb der aktuellen abtastet. – nottinhill

cat * | grep -c string

Eines der seltenen nützlichen Anwendungen von cat.

Quelle

2008-12-16 12:18:14

256

Diese für mehrere Vorkommen pro Zeile funktioniert:

grep -o string * | wc -l

Quelle

2010-07-14 19:31:55

Das funktioniert auch: 'grep -o Zeichenfolge * --exclude-dir = einige/dir/one/--exclude-dir = einige/dir/two | wc -l'. –

'grep -ioR Zeichenfolge * | wc -l' ist das, was ich benutze, um eine Suche ohne Berücksichtigung der Groß-/Kleinschreibung durchzuführen, rekursive Suche nur nach Übereinstimmungen – LeonardChallis

Diese zeigt die relevanten Dateien und dann die Gesamtzahl der Übereinstimmungen: 'grep -rc test. | awk -F: '$ NF> 0 {x + = $ NF; $ NF = ""; print} ENDE {print "Total:", x} ' – Yaron

Obligatorische AWK Lösung:

grep -c string * | awk 'BEGIN{FS=":"}{x+=$2}END{print x}'

Vorsicht, wenn die Dateinamen ":" though.

Quelle

2011-09-29 12:26:37 mumrah

Die AWK-Lösung, die auch Dateinamen einschließlich Doppelpunkte Griffe:

grep -c string * | sed -r 's/^.*://' | awk 'BEGIN{}{x+=$1}END{print x}'

Beachten Sie, dass diese Methode immer noch tut nicht mehrere Vorkommen von string auf der gleichen Linie zu finden.

Quelle

2013-01-25 20:07:35 Kreuvf

grep -oh string * | wc -w

werden mehrere Vorkommen in einer Linie

Quelle

2013-02-27 07:40:33 Kaofu

+14

'grep -oh" ... mein Curry war stark "* >> wc' :) – icc97

Etwas anders als alle bisherigen Antworten zählen:

perl -lne '$count++ for m/<pattern>/g;END{print $count}' *

Quelle

2013-02-27 08:00:26 Vijay

Schön, einen Ansatz zu sehen, der grep nicht verwendet, besonders als grep (unter Windows) unterstützt die Option -o nicht. –

Sie können -R hinzufügen rekursiv suchen (und nicht die Katze verwenden) und -I Binärdateien ignorieren.

grep -RIc string .

Quelle

2013-12-12 12:18:30 azmeuk

Ein anderer oneliner, der grundlegende Befehlszeilenfunktionen verwendet, die mehrere Vorkommen pro Zeile behandeln.

cat * |sed s/string/\\\nstring\ /g |grep string |wc -l

Quelle

2014-01-23 16:26:55 NTwoO

Hier ist eine schneller als grep AWK alternative Art und Weise, dies zu tun, die mehrere Spiele von <url> pro Zeile behandelt, innerhalb einer Sammlung von XML-Dateien in einem Verzeichnis:

awk '/<url>/{m=gsub("<url>","");total+=m}END{print total}' some_directory/*.xml

Dies funktioniert gut in Fällen, in denen einige XML-Dateien keine Zeilenumbrüche haben.

Quelle

2014-06-11 19:02:34 Excalibur

Sie können eine einfache grep verwenden, um die Anzahl der Vorkommen effektiv zu erfassen. Ich werde die -i Option verwenden, um sicherzustellen, dass STRING/StrING/string richtig erfasst werden.

Befehlszeile, die den Namen Dateien gibt:

grep -oci string * | grep -v :0

Befehlszeile, die die Dateinamen und druckt 0 entfernt, wenn es eine Datei ohne Vorkommen ist:

grep -ochi string *

Quelle

2015-06-12 13:19:38

Könnten Sie bitte mehr Ihre Antwort ausarbeiten, indem Sie etwas mehr über die von Ihnen angebotene Lösung hinzufügen? – abarisone

nur Grep Lösung, die ich getestet mit grep für windows:

grep -ro "pattern to find in files" "Directory to recursively search" | grep -c "pattern to find in files"

Diese Lösung zählt alle Vorkommen es auch wenn es mehrere auf einer Linie gibt. -r durchsucht rekursiv das Verzeichnis, -o wird "nur den Teil einer Zeile anzeigen, die PATTERN entspricht" - dies teilt mehrere Vorkommen in einer einzelnen Zeile auf und lässt grep jede Übereinstimmung in einer neuen Zeile drucken; Dann leiten Sie diese Zeilentrennungs-Ergebnisse in grep mit -c zurück, um die Anzahl der Vorkommen mit demselben Muster zu zählen.

Quelle

2015-12-15 19:05:18 Quantic

kurze rekursive Variante:

find . -type f -exec cat {} + | grep -c 'string'

Quelle

2017-07-17 16:25:39

Zählen alle Vorkommen einer Zeichenfolge in vielen Dateien mit grep

Antwort

Verwandte Themen