2017-07-20 5 views
0

Ich versuche, den folgenden Text aus dem XML-Unerwartete Ergebnisse XML in Python Parsen

title_text = word1 Word2 word3 word4 

Das Problem ist, zu analysieren, dass mit dem Code unten ich title_text = 'word1' bekommen.

Wie kann ich das erreichen?

XML:

<response>...<results>...<grouping>...<group>... 
    <doc>... 
     <title> 
      word1 
      <hlword>Word2</hlword> 
      <hlword>word3</hlword> 
      word4 
      </title> 
      ... 
    </doc> 
</group>...</grouping>...</results>...</response>... 

-Code für Parse:

from lxml import objectify 
... 
tree = objectify.fromstring(xml) 
nodes = tree.response.results.grouping.group 
for node in nodes: 
    title_element = node.doc.title 
    title_text = title_element.text 
    print title_text 

Antwort

1

Gerade iterieren .itertext():

>>> for node in nodes: 
... print(' '.join(node.doc.title.itertext())) 
... 
word1 word2 word3 word4