2017-04-12 3 views
0

Ich habe tausend HTML-Seiten (ohne Admin-Panel) mit Codes von Adsense. Und ich möchte alle von ihnen aus dem HTML entfernen. Ein Code wie folgt aussieht:So entfernen Sie AdSense-Codes von der gesamten Website

<ins class="adsbygoogle" 
style="display:inline-block;width:160px;height:600px" 
data-ad-client="ca-pub-7165746718333100" 
data-ad-slot="9087512399"></ins> 

Ein anderer:

<ins class="adsbygoogle" 
style="display:inline-block;width:160px;height:600px" 
data-ad-client="ca-pub-7163746711373100" 
data-ad-slot="7467236139"></ins> 

Alle von ihnen ähnlich sind, aber nicht gleich. A versuchte, Regex zu schreiben, um es zu finden und zu ersetzen, aber ohne Erfolg.

Irgendein Vorschlag, wie man es automatisch macht?

+0

Welche Sprache verwenden Sie? Wahrscheinlich suchen Sie nach einem Parser (zB 'BeautifulSoup' oder' DOMDocument'). – Jan

+0

Jan, ich mache es ohne Programmiersprache. Ich benutze dieses kleine Programm: http://download-codeplex.sec.s-msft.com/Download/Release?ProjectName=findandreplace&DownloadId=851369&FileTime=130458305187130000&Build=21050. Es kann alle wiederkehrenden Dateien im Ordner finden und ersetzen. Ich kenne auch Java und PHP-Sprachen. – Balconsky

Antwort

2

Sie konnte (beachten Sie meinen Kommentar, dass Sie sollten nicht) verwenden:

(?s:     # parenthesis, turning on dotall mode 
    <ins    # <ins literally 
    (?:(?!</ins>).)*? # anything else lazily afterwards 
         # making sure not to overrun </ins> 
    "adsbygoogle"  # adsbygoogle 
    .*?    # rest 
    </ins>    # closing tag 
) 

diese Spiele vollständig entfernen, siehe a demo on regex101.com.

+0

Ich habe versucht, Ihre Regex, es funktioniert auf Ihrer Demo, aber nicht in Notepadd ++ oder "FindAndReplaceTool" arbeiten. – Balconsky

+0

Ich habe es erneut versucht. Es klappt. Vielen Dank. Du hast meine Zeit gerettet. – Balconsky

Verwandte Themen