Unsere Anwendung verarbeitet Dateien im Format TBX, das eine XML-Datei ist. Wir haben festgestellt, dass eine Drittanbieteranwendung das UTF-8-Stücklistenzeichen (EF BB BF
) in den Wert eines untergeordneten Elements (d. H. <term>[BOM]Value text</term>
) einfügt.BOM-Zeichen in der Mitte der XML-Datei
Ich dachte, dass das BOM-Zeichen nur am Anfang einer Datei verwendet werden sollte, um die Kodierung der gesamten Datei anzuzeigen.
Ist das Platzieren des [BOM] -Zeichens in einer XML-Datei korrekt oder können wir die Datei als beschädigt betrachten?
a) Ein Teil des Textwert des Elements
OR
b):
Wenn die Platzierung nach der XML-Spezifikation korrekt ist, sollten wir die [BOM] Charakter als überlegen Eine Ad-hoc-Anzeige der Codierung für das fragliche Element (und nur für dieses Element und seine untergeordneten Elemente)