2010-12-08 10 views
1

Ich benutze TinyXml, um einige XML zu analysieren, die einige HTML-Entities in Textknoten eingebettet haben. Ich merke, dass TinyXML nur ein XML-Parser ist, also erwarte ich nicht oder möchte sogar, dass TinyXML irgendetwas mit den Entitäten macht. Eigentlich möchte ich, dass sie sie in Ruhe lassen.TinyXML und HTML-Entitäten beibehalten

Wenn ich einige XML wie dieses:

... 
<blah>&uuml;</blah> 
... 

aufrufen Wert() auf der TiXmlText Beispiel erhalte ich:

"uuml;" 

So TinyXml scheint immer die Ampersand zu entfernen. Gibt es irgendeine Möglichkeit, dass ich es alleine lassen kann, so dass es unverändert herauskommt? Schätzen

Ideen ..

Antwort

2

Wenn Sie die TinyXML documentation sehen Sie werden sehen, dass es nur fünf Zeichen-Entities erkennt (&uuml; ist nicht einer von ihnen) sowie Unicode-Codepunkt Syntax &#xA0; oder &#160;.

+1

Ich sehe das, mein Problem ist, dass es Einheiten ruiniert, die es nicht versteht (indem es das kaufmännische Und-Zeichen fallen lässt). Ich möchte, dass es einfach durch Entitäten läuft, die es nicht versteht. – maxpenguin

+1

Ich vermute, das ist ein Fehler, und Sie müssen wahrscheinlich mit dem Autor aufnehmen. Es gibt einen E-Mail-Link auf der TinyXML-Hauptseite. –

+1

okay, ich werde das versuchen - danke. – maxpenguin

Verwandte Themen