Ich versuche, unbenutzte Spannen (d. H. Solche ohne Attribut) aus HTML-Dateien zu entfernen, nachdem ich alle Attribute, die ich nicht wollte, mit anderen regulären Ausdrücken bereinigt habe.Wie kann ich unbenutzte verschachtelte HTML-Span-Tags mit einem Perl-Regex entfernen?
Ich habe ein Problem mit meiner Regex nicht das richtige Paar von Start-und Ende-Tags zu entfernen.
my $a = 'a <span>b <span style="color:red;">c</span> d</span>e';
$a =~ s/<span\s*>(.*?)<\/span>/$1/g;
print "$a\
kehrt
a b <span style="color:red;">c d</span>e
aber ich will es
a b <span style="color:red;">c</span> de
Hilfe geschätzt zurückzukehren.
Eier, Wurst gebackene Bohnen – Schwern