Hier ist mein Python-Code mit lxmllxml entfernt ungeöffneten Text innerhalb Tages
import urllib.request
from lxml import etree
#import lxml.html as html
from copy import deepcopy
from lxml import etree
from lxml import html
some_xml_data = "<span>text1<div>ddd</div>text2<div>ddd</div>text3</span>"
root = etree.fromstring(some_xml_data)
[c] = root.xpath('//span')
print(etree.tostring(root)) #b'<span>text1<div>ddd</div>text2<div>ddd</div>text3</span>' #output as expected
#but if i do some changes
for e in c.iterchildren("*"):
if e.tag == 'div':
e.getparent().remove(e)
print(etree.tostring(root)) #b'<span>text1</span>' text2 and text3 removed! how to prevent this deletion?
Es sieht aus wie nach mir einige Änderungen am lxml Baum (löschen einige Tags) lxml auch einig ungeöffneten Text entfernen! Wie verhindere ich, dass lxml dies tut und nicht gespeicherten Text speichert?