Der Versuch, Linux Curl zu verwenden, um eine XML-Datei von einer URL herunterzuladen.linux curl speichern als utf-8
ziemlich sicher, dass die XML in UTF-8 codiert ist,
ahnend curl -o doesnt als UTF-8 speichern.
Gibt es trotzdem zu erzwingen speichern UTF-8 mit Curl?
Danke für die Anregung, was ich herausgefunden:
Da der XML-Feed dynamisch ist, nicht die ganze Zeit es keine utf-8 Zeichen lang sein. Manchmal hat es überhaupt keine utf-8-Zeichen im gesamten Inhalt, obwohl es im xml-Codierungs- und Header-Inhaltstyp als utf-8 gesetzt ist: charset = utf-8. Wenn es mindestens ein utf-8-Zeichen enthält, wird es als utf-8 gespeichert.
Wenn dies geschieht, lockt curl nicht als utf-8, was sinnvoll ist, da es keine utf-8 Zeichen gibt, warum muss man als utf-8 speichern.
Das ist verdammt knifflig, einige Validatoren müssen gegen utf-8 gültig sein, daher brauche ich immer noch eine Lösung, um es zu utf8 zu zwingen, weil standardmäßig alle meine XML in utf8-encoding sind.
versuchte die vorgeschlagene Verwendung von iconv f iso8859-1 utf-8 funktioniert nicht für diesen Fall, da ich vermute, es ist nicht in iso8859-1 entweder.
Benötigen Sie noch eine bessere Lösung.
Ich glaube nicht, 'curl' überhaupt keine Änderungen macht, was es holt, und es ist sicherlich nicht neu kodieren Text. – geoffspear
hallo danke ... aber ich schaue nicht re-encode Daten, nur wundernd, warum es nicht als utf-8 speichert, während der Inhalt alr utf-8 – flyclassic
Was macht Sie denken, dass es nicht als utf-8 speichern? Was versuchst du eigentlich zu erreichen? – geoffspear