Gut, Wechsel von der Arbeit Hpricot zu Libxml-Ruby wegen der Geschwindigkeit und gut das Verschwinden von _why, sah Nokogiri für eine Sekunde, aber entschied sich für Libxml-Ruby für Geschwindigkeit und Langlebigkeit. Ich muss etwas Grundsätzliches fehlt aber was im Versuch, nicht zu tun, arbeiten, hier ist meine XML-String:libxml-ruby parsing HILFE
<?xml version="1.0" encoding="utf-8" ?>
<feed>
<title type="xhtml"></title>
<entry xmlns="http://www.w3.org/2005/Atom">
<id>urn:publicid:xx.xxx:xxxxxx</id>
<title>US--xxx-xxxxx</title>
<updated>2009-08-19T15:49:51.103Z</updated>
<published>2009-08-19T15:44:48Z</published>
<author>
<name>XX</name>
</author>
<rights>blehh</rights>
<content type="text/xml">
<nitf>
<head>
<docdata>
<doc-id regsrc="XX" />
<date.issue norm="20090819T154448Z" />
<ed-msg info="Eds:" />
<doc.rights owner="xx" agent="hxx" type="none" />
<doc.copyright holder="xx" year="2009" />
</docdata>
</head>
<body>
<body.head>
<hedline>
<hl1 id="headline">headline</hl1>
<hl2 id="originalHeadline">blah blah</hl2>
</hedline>
<byline>john doe<byttl>staffer</byttl></byline>
<distributor>xyz</distributor>
<dateline>
<location>foo</location>
</dateline>
</body.head>
<body.content>
<block id="Main">
story content here
</block>
</body.content>
<body.end />
</body>
</nitf>
</content>
</entry>
</feed>
gibt es etwa 150 solcher Einträge aus dem kompletten Feed.
Ich möchte nur die 150 Einträge durchlaufen und dann Inhalte und Attribute herausholen, aber ich habe eine Menge Zeit mit libxml-ruby hatte es funktioniert gut mit Hpricot.
Dieser kleine Ausschnitt zeigt, dass im nicht einmal die Einträge bekommen:
parser = XML::Parser.string(file)
doc = parser.parse
entries = doc.find('//entry')
puts entries.size
entries.each do |node|
puts node.inspect
end
Irgendwelche Ideen? Ich habe die Dokumente durchgesehen und konnte keine einfache XML-Datei finden, und hier sind Beispiele für den Auszug von x, y, z. Das sollte ziemlich einfach sein.
Ich habe vergessen, auf diesen Thread zurück, aber ja, ich habe etwas ähnliches Tin – initialized