Ich möchte alle HTML-Tags aus dem Grep-Ergebnis beim Analysieren von HTML-Seite entfernen, so das Ergebnis wäre Klartext, wie zum Beispiel beim Analysieren von PHPinfo, um nur PHP-Version anstelle der vollständigen Zeile zu erhalten HTML-Tags:sed HTML
$curl -i http://piscina.tienda/phpinfo.php | grep 'PHP Version' | head -1
href="http://www.php.ne.... alt="PHP logo" /></a><h1 class="p">PHP Version 5.5.33</h1>
Während ich möchte nur bekommen "PHP Version 5.5.33" als Ergebnis.
Ich habe versucht, folgende sed Muster:
sed -e 's/<.*>//g'
sed -e 's/^<.*>$//g'
Aber das Ergebnis ist voll HTML-Code oder alle leer (alle Ausgaben ersetzt wird). Könnten Sie bitte sagen, ob es möglich ist, in diesem Fall nur HTML-Tags mit sed zu entfernen oder in diesem Fall lieber einen anderen Operator zu verwenden? Oder das Problem ist mit Muster?
Vielen Dank im Voraus für irgendwelche Tipps!
'sed -e 's/<\/?[^>] *> // g''? – anishsane
Das Problem ist mit dem Muster. Auch ist es in diesem speziellen Fall ziemlich einfach, aber im Allgemeinen sollte Regex nicht verwendet werden, um HTML zu analysieren. – 123