Gesamten HTML-Link (einschließlich Text) mit PHP löschen

Ich habe eine Sammlung von Text, den ich versuche, mit PHP dynamisch zu verarbeiten (die Daten stammen aus einer XML-Datei), aber ich möchte den Link und den Text strippen ist verbunden.Gesamten HTML-Link (einschließlich Text) mit PHP löschen

PHPs strip_tags entfernt die <a etc...> und </a>, aber nicht den Text zwischen.

Ich bin derzeit versucht, die Regex preg_replace('#(<a.*?>).*?(</a>)#', '', $content);

Eine andere Sache zu verwenden, zu beachten ist, die Verbindungen Stile haben, Klassen, href und Titel.

Kennt jemand die Lösung?

Quelle

2010-12-10 Pez Cuckow

* (bezogen) * [beste Methoden zu analysieren, HTML] (http://stackoverflow.com/questions/3577641/best-methods-to-parse-html/3577662#3577662) – Gordon

Als Referenz haben Sie die Anker-Tags gruppiert, aber nicht den Inhalt, wo der Profi ist Lügen liegt. preg_replace ersetzt das gruppierte Element (in Klammern eingeschlossen). Sie können jedoch Folgendes versuchen: '# (] *?>. *?) # i' (ich flag für einen case insensitive vergleichen) –

kurz getestet kürzere regex-Version, nur zum Spaß :)' preg_replace ('/ <(?:a|\/)[^> ] *>/',' ', $ data); ' –

ich die Lösung verwendet (s) als Kommentare geschrieben, sie schienen am besten zu funktionieren und waren genau das, was ich gesucht habe!

"Als Referenz haben Sie die Anker-Tags gruppiert, aber nicht den Inhalt, wo das Problem liegt. Preg_replace ersetzt das gruppierte Element (die in Klammern enthalten). Sie können jedoch Folgendes versuchen: #(<a[^>]*?>.*?</a>)#i (i Flag für einen Fall unempfindlich vergleichen)“- Brad Christie

"kurz kürzer regex Version, nur so zum Spaß getestet :) preg_replace ('/<(?:a|\/)[^>]*>/', '', $data);" - Cyber-Guard Entwurf gestern

Quelle

2010-12-12 12:13:36

Da das ein -Element nicht das Online ist, das Ihre Seite brechen kann, sollten Sie besser einen Whitelist-Ansatz verwenden, wie strip_tags().

Quelle

2010-12-10 16:09:40 KingCrunch

Sorry wirklich keine Ahnung was du meinst ...? –

Ich weiß nicht genau, was Sie wollen, aber normalerweise sollten Sie angeben, welche Tags erlaubt sind und nicht, welche nicht erlaubt sind. Wenn Sie die Tags aus Sicherheitsgründen entfernen möchten, denken Sie an _iframe_, _img_ oder _link_. – KingCrunch

-1

Mit regex, aber nicht gründlich getestet

echo preg_replace('#(<a.*?>)(.*?)(<\/a>)#','$2', $str);

Auch die limit Argument auf -1 gesetzt, wird es keine Grenze gesetzt.

Quelle

2010-12-10 16:14:43

können Sie DOMDocument verwenden, zum Beispiel (nicht getestet!):

Oder Simple HTML DOM Parser mit:

$html = file_get_html('http://www.example.com/'); 
foreach($html->find('a') as $element) { 
    $element->outertext = ''; 
} 
$html->save('output.html');

Quelle

2010-12-10 16:15:54 karim79

Kann jemand bitte die Down-Vote erklären? – karim79

Diese Antwort scheint für solch eine einfache Aufgabe übermäßig kompliziert zu sein ... –

@ Cyber-Guard Design - Ich denke nicht, dass es übermäßig kompliziert ist. Und es wird sicherlich zuverlässiger sein als ein regulärer Ausdruck. – karim79

try this:

$content=preg_replace('/<a[^>]*>(.*)<\/a>/iU','',$content);

Quelle

2010-12-10 16:16:46 profitphp

Super!Jetzt sehe ich den Grund, reguläre Ausdrücke gut zu lernen! Und wie entferne ich Tags, aber nicht diejenigen mit "

Gesamten HTML-Link (einschließlich Text) mit PHP löschen

Antwort

Verwandte Themen