Ich versuche, einen regulären Ausdruck zu erstellen, um den Text innerhalb des HTML-Tags wie unten gezeigt zu extrahieren. Allerdings habe ich begrenzte Fähigkeiten in regulären Ausdrücken und ich habe Probleme beim Erstellen der Zeichenfolge.Erstellen von Regular Expression (RegEx) zum Extrahieren von Text des HTML-Tags
Wie kann ich extrahieren den Text aus diesem tag:
<a href="javascript:ProcessQuery('report_drilldown',145817)">text</a>
, dass nur ein Beispiel für den HTML-Quellcode der Seite. Im Grunde brauche ich eine regex
Zeichenfolge, um den "Text" innerhalb des <a>
Tags zu entsprechen. Kann mir jemand dabei helfen? Vielen Dank. Ich hoffe, meine Frage wurde nicht zu schrecklich formuliert.
UPDATE: Nur zur Klarstellung, report_drilldown
ist absolut, aber ich weiß nicht wirklich, wenn es in der regex
als absolute oder nicht vorhanden ist.
145817 ist eine zufällige 6-stellige Zahl, die eigentlich eine Datenbank-ID ist. "Text" ist nur einfacher Text, es sollte also kein ungültiger HTML-Code sein. Auch die meisten Leute sagen, dass es am besten ist, Regex in dieser Situation nicht zu verwenden, also was wäre am besten zu verwenden? Vielen Dank!
regex Mit dem Problem des Parsing HTML zu lösen? Jetzt hast du zwei Probleme. –
Wie so? Ich habe Regex zuvor in einem anderen Projekt mit einer ziemlich ähnlichen Aufgabe verwendet. Vielleicht ist es besser, etwas anderes zu verwenden, um den Text des Tags zu extrahieren? –
HTML mit einer Regex zu analysieren ist im Allgemeinen eine schlechte Sache: http://stackoverflow.com/questions/701166/ – Telemachus