Ich habe Text wie diese -mit regulärem Ausdruck und Rekonstruieren ursprüngliche Zeichenfolge
This is a test text. <span> with bold </span> and with <span> italic </span> and so on and so forth.
Nun, ich diese Regex bin mit allen HTML zu identifizieren <[^>]*>
ich dann bin alle HTML mit leeren Zeichenfolge zu ersetzen, so dass die Ergebnis wäre wie dies
This is a test text. with bold and with italic and so and so forth.
im obigen Text ich Text identifizieren will, sagt sie, „kursiv“ und legen sie spezielle Tags um ihn herum und dann den ursprünglichen Text zu rekonstruieren. So wäre das Ergebnis
This is a test text. <span> with bold </span> and with <span> <span class='special'>italic</span> </span> and so on and so forth.
I-Code bin zu schaffen, die matcher.start gets() und matcher.end(), um eine Liste aller HTML-Tags zu machen, dann ich denke an dieser reconstrucing basierend Liste. Gibt es einen besseren Weg, es zu tun? Wie würdest du es lösen?
EDIT
Der Grund für die Textsuche nach html ersetzen ist, weil das HTML-interferiert mit dem Text ich suche. So zum Beispiel könnte es so sein
This is a test text. <span> with bold </span> and with <span> it</span>al<span>ic </span> and so on and so forth.
EDIT2
Dies ist kein Duplikat Frage, wie es vorgeschlagen wird. Stellen Sie sich ein Szenario vor, in dem Sie den HTML-Code, den Sie auf dem Bildschirm sehen, markieren müssen, indem Sie lediglich einen einfachen Bereich mit der Hintergrundfarbe Gelb zum Text Ihrer Wahl hinzufügen. Nun stellen Sie sich vor, dass dieser Text das Wort kursiv ist, aber es erscheint als <span>ita</span>l<span>ic</span>
. Meine Frage ist, wie würdest du dieses Wort finden und es dann umspannen?
EDIT3 Letzte Bearbeitung, um die Problemstellung zu vereinfachen. Ich hoffe, das macht es deutlich. Dies ist der Eingang -
This is a test text with <span>it<span>al<span>ic</span> and etc.
Dies ist die erwartete Ausgabe -
This is a test text with <span class='highlight'><span>it<span>al<span>ic</span></span> and etc.
Wie würden Sie herausfinden, welcher Text Tags nach dem Ersetzen hatte? – shmosel
aus dem ursprünglichen Text, ich weiß, wo die Tags vorhanden sind, die versetzt. – Jay
Gibt es einen besonderen Grund, die HTML-Tags zu entfernen und sie dann erneut hinzuzufügen? Es scheint effizienter zu sein, nicht zu entfernen/ersetzen. – KevinO