SO frage ich als letztes Mittel, da ich völlig aus Ideen bin.xml Parse Fehler auf illegale Zeichen
ich ein Windows ASP.NET ASMX Web Services App, die ein serialisierte Person-Objekt mit einer zurückgibt -,, Adresse, E-Mail ... etc
aber einige Attribute in der XML kodiert sind sehr weirdly Namen zum Beispiel-
(Ich weiß nicht, wo die Codierung stattfindet. Ich nehme an in der Serialisierung)
googling those characters Ich sehe, dass es "Windows-1252" Codierung ist.
Das Problem tritt beim Parsen der XML, fand ich, einen Parse-Fehler von "ungültigen Unicode-Zeichen" an der Position der 1252-Codierung.
Wie kann ich es erfolgreich analysieren? Welche Lösungen schlagen Sie vor?
Vielen Dank für Ihre detaillierte Antwort - ich nehme an, die Daten waren als Kopie einfügen aus einer Word-Datei oder etwas dieser Art eingegeben. – bushman
Ja, das wäre für die C1-Steuercodes im Bereich 0x80-0x9F üblich (normalerweise von der Code-Seite 1252 intelligente Anführungszeichen falsch interpretiert als ISO-8859-1), aber der 0x1A-Steuercode wird für nichts durch verwendet Word oder jede andere übliche moderne Windows-App, die ich mir vorstellen kann. – bobince
so bob, ich habe keine Kontrolle über die Daten, wie es zu mir kommt - ist der einzige Weg, um diesen schrecklichen Hack zu haben und es aus der Zeichenfolge zu entfernen oder gibt es eine andere Möglichkeit, es zu repräsentieren - zum Beispiel vor der Serialisierung - - Überprüfen Sie, ob die Zeichenfolge UTF-8 zulässig ist. – bushman