Ich versuche, diese MPEG21 XML file zu analysieren, aber ich habe ein paar Probleme damit. Da es aus der URL zu lesen hat nicht funktioniert, ich die Datei heruntergeladen und lesen Sie die lokale Kopie:Parsing MPEG21 XML-Datei in R
ns <- "http://www.openarchives.org/OAI/2.0/"
file <- "ddd:010168412.xml"
xml.content<- xmlTreeParse(file)
xml.top <- xmlRoot(xml.content)
Nun, was ich brauche, ist für jede ID (zum Beispiel ddd zu extrahieren: 010168412: MPEG-21: A0003), wie in
<didl:Component dc:identifier="ddd:010168412:mpeg21:a0003:zoning">
die IDs der Textblöcke, die zu ihnen gehören, zum Beispiel:
<dcx:TextBlock ID="P1_TB00019"/>
<dcx:TextBlock ID="P1_TB00020"/>
<dcx:TextBlock ID="P1_TB00021"/>
<dcx:TextBlock ID="P1_TB00022"/>
<dcx:TextBlock ID="P1_TB00023"/>
jedoch keiner meiner Versuche, etwas von den Baumarbeiten zu extrahieren, zum Beispiel dieses gibt nichts zurück, nicht einmal einen Fehler:
x <- sapply(getNodeSet(xml.top, "//responseDate"), xmlValue)
Ich habe den Eindruck, dass ich etwas wirklich Grundlegendes übersehe. Irgendeine Idee?