Ich habe eine XML-Datei, die wie aussieht. Das entsprechende Bit ist dies:pyquery (lxml) Kein Tag in einem gut strukturierten XML-Dokument gefunden?
<reference>
<citation>Vander Wal JS, Gang CH, Griffing GT, Gadde KM. Escitalopram for treatment of night eating syndrome: a 12-week, randomized, placebo-controlled trial. J Clin Psychopharmacol. 2012 Jun;32(3):341-5. doi: 10.1097/JCP.0b013e318254239b.</citation>
<PMID>22544016</PMID>
</reference>
Ich versuche, den Wert des PMID
Feld zu finden, PyQuery mit dem XML zu analysieren:
from pyquery import PyQuery as pq
text = open(f, 'r').read()
d = pq(text)
data = {}
data['nct_id'] = d('nct_id').text()
print d('reference')
reference = d('reference')
print reference('PMID')
data['pmid'] = reference('PMID').text()
print data['PMID']
Warum ist das nicht funktioniert? In der Konsole sehe ich den Gesamtinhalt reference
von der ersten print-Anweisung, gefolgt von zwei leeren Werten:
<reference>
<citation>Vander Wal JS, Gang CH, Griffing GT, Gadde KM. Escitalopram for treatment of night eating syndrome: a 12-week, randomized, placebo-controlled trial. J Clin Psychopharmacol. 2012 Jun;32(3):341-5. doi: 10.1097/JCP.0b013e318254239b.</citation>
<PMID>22544016</PMID>
</reference>
ich andere Blattknoten in dem Dokument finden (wie nct_id
) ganz gut .find()
mit, wie das Beispiel Code zeigt.
Hat PyQuery keine Großbuchstaben?
Das tat es! Vielen Dank! – Richard