2016-10-18 1 views
1

Firefox kann '囧' in gb2312 codiertem HTML anzeigen. Aber u'囧'.encode('gb2312') wirft UnicodeEncodeError.u '囧' .encode ('gb2312') wirft UnicodeEncodeError

1.Ist dort eine Karte, so kann Firefox gb2312 codierte Zeichen in dieser Karte nachschlagen, 01 Anzeigematrix finden und anzeigen.

2.Es gibt eine Karte zum Übersetzen von Unicode zu gb2312 aber u'囧' ist nicht in dieser Karte?

+0

Sind Sie sicher, dass es in GB2312 ist? [Diese Tabelle hat es nicht] (http://ash.jp/code/cn/gb2312tbl.htm). –

+0

Sie finden '囧' in (http://www.dytt8.net/) und diese Seite ist in gb2312 codiert. – user3822769

Antwort

3

囧 nicht in gb2312, stattdessen gb18030 verwenden. Ich denke, Firefox kann die Methode encode erweitern, wenn sie unbekannten Charakteren gegenübersteht.

2

Wenn Leute oder Software sagen, dass etwas GB2312-kodiert ist, meinen sie meistens, dass es in der GBK-Kodierung kodiert ist, a.ka.CP936 von Microsoft. GB2312 war eine Teilmenge von GBK, die in den 1980er Jahren verwendet wurde, aber beide sind Teil der same family of encodings.

Übrigens empfiehlt die bevorstehende WhatWG's encoding specification, jeden Text, der als "gb2312" bezeichnet wird, als GBK-kodierten Text zu behandeln.

Versuchen Sie daher u'囧'.encode('gbk') oder u'囧'.encode('cp936') oder u'囧'.encode('windows-936').

Verwandte Themen