Guten Morgen ExtrahierenRegex für nur TR mit TDs
Ich versuche, eine Tabellenzeile (TR) zu erhalten, die eine oder mehrere Tabellenzellen (TDs) haben müssen:
Mit diesen String
<TABLE>
<TR valign="top">
<TH>First</TH>
<TH>2nd</TH>
<TH>3rd</TH>
<TH>4th</TH>
</TR>
<TR valign="top">
<TD width="15%">Michael Jackson</TD>
<TD width="5%">Cramberries</TD>
<TD width="25%">Pixies</TD>
<TD width="45%">The Ramones</TD>
</TR>
</TABLE>
möchte ich bekommen:
<TR valign="top">
<TD width="15%">Michael Jackson</TD>
<TD width="5%">Cramberries</TD>
<TD width="25%">Pixies</TD>
<TD width="45%">The Ramones</TD>
</TR>
was wäre das beste Muster ein zum Extrahieren oder mehr TRs mit verschachtelten TDs ?
'Du sollst nicht regex verwenden HTML' zu analysieren. Verwenden Sie eine DOM-Manipulationsbibliothek in Ihrer Sprache. –
@Jan Es wird in C# zum Parsen einer HTML-Zeichenfolge verwendet –
Bitte lesen Sie diese Antwort http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454 # 1732454 –