Ich habe eine reine HTML-Datei sieht wie folgt aus (Inhalt von Zeit zu Zeit ändern können, wissen wir alle, dass es eine gültige HTML-Datei ist):Markieren Sie Text in HTML programmaticly
<HTML>
<BODY>
<h1>Hello World</h1>
<p>
This is my paragraph
</p>
<div>
another text
</div>
</BODY>
</HTML>
Wenn ich es in Browser öffnen Es sieht so aus:
Jetzt möchte ich einige Textteile innerhalb dieser HTML-Datei hervorheben. Nehmen wir an, ich möchte den Text markieren: "Welt Dies ist mein Absatz ein anderes".
Erwartete Ausgabe:
<HTML>
<BODY>
<h1>Hello <mark>World</mark></h1>
<p>
<mark>This is my paragraph</mark>
</p>
<div>
<mark>another</mark> text
</div>
</BODY>
</HTML>
Sie haben:
- Raw HTML-Datei (wie oben dargestellt)
- Ein Satz, der Sie sicher wissen, dass innerhalb der erscheinen Textversion des HTML. Beachten Sie, dass dieser Satz in mehreren HTML-Knoten platziert werden kann (wie im obigen Beispiel. Übergeordnete Knoten: h1, p und div).
- Eine Python-Script-Skriptdatei zur Automatisierung des Hervorhebungsvorgangs.
Ich dachte, dass Regex ein guter Ort ist, um nach einer Lösung zu suchen. Aber ich steckte fest, sobald ich ein Szenario betrete, in dem der Text mit mehreren Eltern geteilt wird. Darüber hinaus können weitere Elemente zwischen den Wörtern platziert werden (z. B. img).
Auf der Suche nach einem Hinweis, wo die Lösung zu finden?
Ihre Frage ist ** ** unklar, ob A) Sie uns wollen, sind das Programm für Sie zu schreiben, was ** zu breit ** ist (und in der Regel verpönt, auch wenn schmal genug, um nicht zu sein breit, da SO kein Code-Schreibdienst ist); B) eine Anfrage an uns, um eine Bibliothek zu finden, die dies tut, was eine Anfrage für externe Ressourcen ist, die ** off-topic: Ressourcenanfrage ** ist; oder C) eine Anfrage zum Debuggen Ihres Codes, die ** off-topic: no MCVE ** ist, es sei denn, Sie bieten alles, was für das Debuggen von Fragen in [Hilfe/on-topic], einschließlich eines [MCVE], aber Sie bereitgestellt haben Kein Code, obwohl du gesagt hast, dass du es versucht hast. – Makyen