2017-03-10 1 views

Ich mag würde diese xml Art Datei analysieren:XML Parsing in Python (Elia Struktur)

<?xml version="1.0" encoding="utf-8"?> 
<SolarForecastingChartDataForZone xmlns="http://schemas.datacontract.org/2004/07/Elia.PublicationService.DomainInterface.SolarForecasting.v3" xmlns:i="http://www.w3.org/2001/XMLSchema-instance"> 
    <ErrorMessage i:nil="true"/> 
     <StartsOn xmlns:a="http://schemas.datacontract.org/2004/07/System"> 

das Niveau zu erholen <Forecast> und <a:DateTime>

ich mit schönen Suppe und minidom versucht, zum Beispiel:

from xml.dom import minidom 
xmldoc = minidom.parse('xmlfile') 
itemlist = xmldoc.getElementsByTagName('Forecast') 
print(len(itemlist)) #to get the number of savings 
for s in xmldoc.getElementsByTagName('Forecast'): 
    print s.nodeValue 

Aber ich kann keinen Wert haben. Ich denke, ich liege falsch, aber ich verstehe nicht warum. Jemand könnte mir helfen? Danke



Nicht genau, was Ihre gewünschte Ausgabe ist, aber ich arbeitete mit LXML und XPATH, als ich diese Frage sah.

from lxml import html 
mystring = ''' I cut and pasted your string here ''' 
tree = html.fromstring(mystring) 
>>> for forecast in tree.xpath('//forecast'): 

>>> for dtime in tree.xpath('//datetime'): 


und dann in Unordnung um ein bisschen mehr

all_elements = [e for e in tree.iter()] 
for each_element in all_elements[1:]: # The first element is the root - it has all the text without the tags though so I don't want to look at this one 
    each_element.tag, each_element.text_content() 

('errormessage', '') 
('intervalinminutes', '15') 
('solarforecastingchartdataforzoneitems', '\n \n  -50\n  -50\n  -50\n  0\n  0\n  0\n  0\n  -50\n  -50\n  0\n  0\n  \n   2013-09-29T22:00:00Z\n   0\n  \n  -50\n  -50\n  -50\n \n \n  -50\n  -50\n  -50\n  0\n  0\n  0\n  0') 
('solarforecastingchartdataforzoneitem', '\n  -50\n  -50\n  -50\n  0\n  0\n  0\n  0\n  -50\n  -50\n  0\n  0\n  \n   2013-09-29T22:00:00Z\n   0\n  \n  -50\n  -50\n  -50\n ') 
('dayaheadforecast', '-50') 
('dayaheadp10', '-50') 
('dayaheadp90', '-50') 
('forecast', '0') 
('forecastp10', '0') 
('forecastp90', '0') 
('forecastupdated', '0') 
('intradayp10', '-50') 

denke ich, das Hauptproblem ist gelöst. Ich werde codieren, um die korrekte Ausgabe zu haben. Danke – Ksartor