Ich versuche, einen regulären Ausdruck für die folgende String-Eine einfache Regex Ausgabe
<tr>
<td colspan=2>
<p><b>
CITY Head:
<span >
<span >##CITY##</span>
<o:p></o:p>
</span>
</b>
</p>
</td>
<td colspan=1>
ich den ganzen TD Block mit CITY Kopf darin finden wollen zu erstellen. Ich könnte mit dem folgenden Regex kommen.
<td(.*)[\s](.*)[\s]+CITY Head+(.*)[\s](.*)[\s](.*)[\s](.*)[\s](.*)[\s](.*)[\s](.*)[\s]+<\/td>
Im Grunde hatte ich über und unter dem CITY Kopf(.*)[\s]
für alle Zeilen zu schreiben. Dies kann jedoch in verschiedenen Fällen unterschiedlich sein.
Daher suche ich nach einer allgemeinen Möglichkeit, alle (.*)[\s]
in etwas unabhängig von der Anzahl der Zeilen zu kombinieren.
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – HRgiger
Aber wie Bobince sagt: * "Also los, parse HTML mit regex, wenn du musst, es ist nur gebrochener Code, nicht Leben und Tod. "* –
Ja, dem Ratschlag von Bobince folgend, konnte man schließlich temperierte gierige Token studieren. Wenn Sie Probleme mit der Leistung haben, fahren Sie mit der Untersuchung der Loop-Technik fort. Und am Ende merke nur, dass ein DOM-Parser so viel einfacher war. –