Regex gegen manuellen Vergleich. Welche ist schneller?

in einer Scripting-Engine zu schreiben, habe ich Funktionen wie (Pseudocode)Regex gegen manuellen Vergleich. Welche ist schneller?

function is_whitespace?(char c){ 
    return c==' ' || c=='\t' || c=='\r' || c=='\n'; 
}

Nun, meine Frage ist, was in den meisten langugaes schneller ist? Das oder mit regex wie

function is_whitespace?(char c){ 
    return regex_match('\s',c); 
}

Die Hauptsprachen ich bin besorgt sind C#, C und Ruby auch falls es vollständig plattformabhängig ist.

Quelle

2010-04-05 Earlz

Scheint einfach genug, um einen schnellen Test zu machen, um es herauszufinden. Erzeugen Sie eine Datei voller zufälliger Zeichen und übergeben Sie sie durch beide Funktionen. –

Ich denke du meintest '\ s' statt '\ w' dort. – sepp2k

ja, das ist wahr .. Mono muss für den C# -Test aber reichen .. – Earlz

Natürlich sind vier Vergleiche kleiner Speicherbereiche viel schneller (und verwenden fast keinen Speicher) als das Erstellen, Ausführen und Zerstören eines Zustandsautomaten.

Quelle

2010-04-05 18:46:04 wRAR

+1. Beachten Sie, dass kompliziertere Beispiele die Regex möglicherweise schneller verwenden. –

Nun, wann schlägt Regex (naive) manuelle Vergleiche? – Earlz

Meine Vermutung ist nie, aber ein Matcher für eine reguläre Sprache von Hand zu codieren könnte sehr kompliziert werden im Vergleich zum Schreiben einer Regex. – danben

In den meisten Fällen ist die Regex, um etwas wie ein Leerzeichen zu finden, sehr schnell. Sie haben viele Blicke auf die Leistung in den führenden Regex-Implementierungen und es gibt wahrscheinlich andere Bereiche von "tief hängenden Früchten" zur Optimierung in anderen Bereichen Ihres Codes.

Die Bereiche schlechter Leistung einer Regex ist eine schlecht geschriebene Regex. Tipps sind, so viel unnötiges Zurückverfolgen, Gruppieren und Ändern wie möglich zu vermeiden. Verwenden Sie so etwas wie "Regex Buddy" oder Perl mit "re-debug verwenden", um zu sehen, wie viele Zweige Ihre Regex braucht.

Die Links sind zu einigen Regex-Leistungsproblemen.

Im Zweifelsfall tut Vergleich Timings ...

Coding Horor- Regex

Java Performance - Regex

Quelle

2010-04-05 18:55:41 dawg

Der manuelle Vergleich ist schneller auszuführen, ist der regex Vergleich schneller tippen.

Beachten Sie, dass Ihre beiden Implementierungen nicht gleichwertig sind, wenn Ihr System Unicode verwendet. Die Regex \s stimmt mit allen Unicode-Leerzeichen überein, während Ihr manueller Vergleich nur das grundlegende ASCII behandelt und nicht einmal die vertikalen Tabulatoren und die Zeichen für die Formularzuführung enthält, die normalerweise auch als Leerzeichen betrachtet werden.

Wenn Sie dies in einer Hochsprache schreiben, würde ich vorschlagen, die is_whitespace() - Funktion zu verwenden, die bereits von den Bibliotheken Ihrer Programmiersprache bereitgestellt wird. Eine grundlegende Funktion wie diese ist fast immer enthalten.

Also am Ende ist die Antwort "es kommt darauf an". In einigen Situationen ist der zusätzliche Programmieraufwand bei der Verwendung von Verfahrenscode gerechtfertigt. In vielen Fällen ist die Regex schnell genug und einfacher zu warten.

Quelle

2010-04-06 09:17:07

Kommt es nicht darauf an, ob Ihre Regex-Implementierung Unicode-fähig ist? (und Ihre Sprache. Zum Beispiel glaube ich, Ruby ist immer noch nicht Unicode-bewusst) – Earlz

Ich sagte: "Wenn Ihr System Unicode verwendet". Damit meinte ich sowohl die Programmiersprache als auch den Regex-Geschmack. Die Regex-Variante in Ruby 1.8 unterstützt nicht Unicode, die in Ruby 1.9. –

Nach der Plattennutzung sind Regexes fast immer mein Leistungsengpass, wenn ich meinen Code profiliere. selbst für einfache Dinge wie .split ("").

Quelle

2011-01-31 19:11:16 user508546

Ich kann nicht über C# oder C sprechen, aber ich würde nicht annehmen, dass die Nicht-Regex-Form in Ruby schneller ist.

Quelle

2011-03-04 02:34:57

Regex gegen manuellen Vergleich. Welche ist schneller?

Antwort

Verwandte Themen