Ich versuche, nicht-gierig TD-Tags aussortieren. Ich beginne mit etwas wie folgt aus:Regex Non-Greedy
<TD>stuff<TD align="right">More stuff<TD align="right>Other stuff<TD>things<TD>more things
ich die unten als meine regex:
Regex.Split(tempS, @"\<TD[.\s]*?\>");
Die Datensätze zurück, wie unten:
""
"stuff<TD align="right">More stuff<TD align="right>Other stuff"
"things"
"more things"
Warum ist es nicht das erste volle Ergebnis aufteilen (das mit "stuff" anfangen)? Wie kann ich die Regex anpassen, um alle Instanzen des TD-Tags mit oder ohne Parameter zu teilen?
Bitte sehen http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags –
'.' bedeutet einfach einen Literalpunkt in der Zeichenklasse '[.]', nicht 'irgendein Zeichen. Mit _ [^>] * 'könnten Sie _mehr_ Erfolg haben, _aber mit einem'> 'in einem Attribut (was einer der Gründe ist, warum wir uns oft die Parser anschauen, sondern die Regexes, um HTML & Xml zu manipulieren). – Wrikken
@Wrikken Das HTML ist hier ziemlich statisch. Es gibt nicht viel Variation und ich kenne die Regex, die dafür arbeiten würde. Ich bin deswegen nicht auf Parser gegangen. Gibt es eine Möglichkeit, das zu machen? Zeichen bedeuten 'irgendein Zeichen' inklusive Leerzeichen? – steventnorris