ich eine einfache regex zu machen versuchen, aber ich einige Schwierigkeiten mit etwas mit „*.“:Regex, stoppt passende
Lassen Sie sich den folgenden Text vor:
<div class="thread">things</p></div><div class="thread">things</p></div>
<div class="thread">things</p></div>
Ich mag passen alle things
. Zu wissen, dass things
buchstäblich alles sein kann.
Also, zuerst begann ich mit diesem Regex: /<div class\=\"thread\">(.*)<\/p><\/div>/
und ich fügte einen Modifikator hinzu, um die zweite Linie auch zu entsprechen.
Problem ist, diese Regex gibt nur ein Spiel:
things</p></div><div class="thread">things</p></div>
<div class="thread">things
Weil es bei der ersten <div class="thread">
beginnt und endet an der letzten </p></div>
Wie konnte ich die Regex anweisen zu stoppen passende .*
nach die erste </p></div>
?
Sie sollten einen DOM-Parser verwenden, wenn Sie erwarten, dass Sie etwas Komplizierteres als dieses finden müssen. –
Ich habe versucht, einen DOM-Parser zu verwenden, aber ich muss eine 100 MB-Datei analysieren, und der Parser mag das nicht sehr viel – Hammerbot