I-Code habe für mehr XML-Dateien aus verschiedenen Verzeichnissen Parsen:mehrere XML-Datei aus mehreren Ordnern analysieren, gleiches Format hat, und speichern Sie Text spezifische Knoten in einer Variablen
for file in glob.iglob(os.path.join(dir, '100/**/*.xml')):
with open(file) as f:
data = etree.parse(f)
Format von XML-Dateien ist:
<us1>
<us2>
<p-r>
<document-id>
<country>US</country>
<doc-number>07640598</doc-number>
<kind>B1</kind>
<date>20100105</date>
</document-id>
</p-r>
<ab>
<c>
<document-id>
<country>US1</country>
<doc-number>07640598989834</doc-number>
<kind>B5</kind>
<date>20100106</date>
</document-id>
</c>
</ab>
</us2></us1>
Nun, ich möchte Text in "Doc-Nummer" zwischen allen xml-Dateien im Verzeichnis extrahieren und speichern in einer Variablen .. extrahierte Daten ist 07640598. Wie extrahiere ich ausgewählte Werte und speichern es in einer Variablen?
ya, das ist eine Möglichkeit. Aber was soll ich "doc_no" von "p-r" bekommen und nicht von anderen Tags? – curiouscoder
danke @ har07 für Hilfe. – curiouscoder
@ Curiouscoder Kein Problem. Vergessen Sie nicht, die Antwort zu akzeptieren ([mehr Informationen über * Annahme der Antwort *] (http://meta.stackexchange.com/questions/5234/how-does-accepting-an-answer-work)) – har07