2016-09-15 2 views
0

Ich versuche, den schwedischen Inhalt von einer anderen Website zu holen. Ich kann die Daten abrufen, aber die schwedischen Buchstaben (ÅÖÄ) fehlen. Schwedischer Inhalt, den ich direkt hinzugefügt habe, hat kein Problem anzuzeigen, da ich das Meta-Tag hinzugefügt habe. Das Problem ist, wenn ich versuche, die Daten von einer anderen Website anzuzeigen. Ist es möglich, dieses Problem zu beheben? Ich habe keinen Zugriff auf andere Websites.schwedische Zeichen fehlen beim Anzeigen auf HTML-Formular

+0

Ihre Website hat die gleiche Codierung der anderen Seite nicht nutzen. Dies ist kein HTML-Problem. Fügen Sie weitere Informationen dazu hinzu, was Sie gerade tun – Wes

+1

Wie versuchen Sie, diese Daten zu erhalten? Sie haben keinen Code angegeben, was Sie erreichen möchten. – mlegg

Antwort

1

Um schwedische Zeichen zu berücksichtigen, müssen Sie charset auf UTF-8 einstellen. Ein Beispiel aus MDN ist:

<!-- In HTML5 --> 
<meta charset="utf-8"> 

<!-- Defining the charset in HTML4 --> 
<!-- Note: This is invalid in HTML5 --> 
<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 

Der Meta-Tag geht im <head> Tag wie so:

<html> 
    <head> 
    <meta charset="UTF-8"> 
    </head> 
</html> 

Zitat aus MDN:

[charset] erklärt die Zeichenkodierung verwendet der Seite. Es kann mit dem Attribut lang für jedes Element lokal überschrieben werden. Dieses Attribut ist eine literale Zeichenfolge und muss einer der bevorzugten MIME Namen für eine Zeichencodierung sein, wie von der IANA definiert. Obwohl die Standard keine bestimmte Zeichencodierung anfordert, gibt es einige Empfehlungen:

  • Autoren ermutigt werden, UTF-8 zu verwenden.
  • Autoren sollten nicht ASCII-inkompatiblen Kodierungen verwenden (dh diejenigen, die den 8-Bit-Code nicht zuordnen können Punkte 0x20 bis 0x7E die Unicode 0x0020 bis 0x007E Codepunkte), da diese ein Sicherheitsrisiko darstellen: Browser unterstützt sie nicht kann gutartigen Inhalt als HTML Elemente interpretieren. Dies ist der Fall von mindestens den folgenden Zeichensätzen: JIS_C6226-1983, JIS_X0212-1990, HZ-GB-2312, JOHAB, der ISO-2022 Familie und der EBCDIC-Familie.
  • Autoren dürfen keine CESU-8, UTF-7, BOCU-1 und SCSU verwenden, die ebenfalls in diese Kategorie fallen und nicht für die Verwendung im Internet vorgesehen sind. Cross-Scripting-Angriffe mit einigen dieser Kodierungen wurden dokumentiert.
  • Autoren sollten UTF-32 nicht verwenden, da nicht alle HTML5-Codierungsalgorithmen UTF-16 unterscheiden können.

Here ist auch ein Link auf UTF-8.

* Hinweis: Wenn aus irgendeinem Grund UTF-8 Codierung ist nicht für Ihre Charaktere arbeiten, versuchen charset="ISO-8859-1"

+0

"Setzen Sie den Zeichensatz auf UTF-8": Nicht genau, charset _documents_ Der Zeichensatz und die Codierung, die vom Dokument verwendet werden. Es sollte darauf eingestellt sein, was auch immer es ist. Wenn das Dokument von einer Bibliothek generiert oder gespeichert wird, wird dieser Wert basierend auf der Codierung festgelegt, die zum Speichern der Datei verwendet wird. Aber wenn Sie einen Texteditor verwenden, speichern Sie ihn als UTF-8, nachdem Sie UTF-8 in das Tag eingegeben haben. –

Verwandte Themen