2009-03-19 23 views
0
xsltCopyText: text allocation failed 
runtime error: element value-of 
xsltValueOf: text copy failed 

Dieser Fehler beim Parsen von XML (Wikipedia Dump, eigentlich) w/XMLStarlet. Ich kann Seitentitel und IDs erhalten, aber wenn es um Seitentexte geht, schlägt es fehl.XMLStarlet: XML Parsing Fehler

Expression verwendet:

xml sel -N xmlns=http://www.mediawiki.org/xml/export-0.3/ -T -t -m "//xmlns:revision" -v "xmlns:text" -n d:\wiki\translated.wiki.xml 

P. S. Ich mache es unter Windows.

Antwort

2

Was ist der Inhalt von translated.wiki.xml? Überprüfen Sie einfach die ersten paar Zeilen, es könnte irgendwo beschädigt worden sein.

Können Sie das Problem auf einer kleinen Teilmenge von translated.wiki.xml reproduzieren? Wikipedia-Dumps sind riesige und oft Absturz-Tools, die Speicher zu gierig zuweisen.

+0

Ich validierte übersetzte.wiki.xml w/XMLStarlet, und es ist konsistent. Ja, es funktioniert ordnungsgemäß auf kleinen Teilmenge. Muss Speicherprobleme sein. Dumm, dumm mir :) –

+0

Okay, Problem gelöst mit Xalan (mit XSLT von XML Starlet generiert). –