2016-10-16 4 views
0

Ich habe HTML und ich möchte IMG-Tag aus ihm entfernen.Entfernen Sie IMG-Tag aus HTML mit Regex - Python 2.7

ich regex nicht gut bin, habe ich diese Funktion aber es IMG-Tag

def remove_img_tags(data): 
    p = re.compile(r'<img.*?/>') 
    return p.sub('', data) 

Was die richtige regex ist nicht entfernen? Ich möchte keine Bibliothek benutzen.

Antwort

1

Alles, was Sie brauchen, ist img Tag zu erfassen und mit leeren String zu ersetzen.

clean_data = re.sub("(<img.*?>)", "", data, 0, re.IGNORECASE | re.DOTALL | re.MULTILINE) 

Sie werden HTML-Inhalte in data werden übergeben. Regex entfernt alle img Tags, deren Inhalt und gibt saubere Daten in clean_data Variable zurück.

1

Try this:

image_tag = re.compile(r'<img.*?/>').search(data).group() 
data.replace(image_tag, '') 
Verwandte Themen