Assert.AreEqual schlägt fehl, auch wenn erwartet und tatsächlich sind die gleichen

Ich habe den folgenden Test, der scheint, die gleichen Zeichenfolgen aber Assert.AreEqual schlägt fehl.Assert.AreEqual schlägt fehl, auch wenn erwartet und tatsächlich sind die gleichen

[TestMethod] 
public void Decompressed_test_should_equal_to_text_before_compression() 
{ 
    TextCompressor compressor = new TextCompressor(); 
    Random r = new Random((int)DateTime.Now.Ticks); 

    for (int i = 500; i < 1500; i++) 
    { 
     char[] testArray = new char[i]; 

     for (int j = 0; j < i; j++) 
     {      
      char randomChar = (char)(r.Next(256, 65536)); 
      testArray[j] = randomChar; 
     } 
     string testString = new String(testArray); 
     string compressed = compressor.Compress(testString); 
     string decompressed = compressor.Decompress(compressed); 

     Assert.AreEqual(testString.Length, decompressed.Length); 
     Assert.AreEqual(testString, decompressed, false, CultureInfo.InvariantCulture); 
    } 
}

compressor.Compress und compressor.Decompress hat einige Kompression und Dekompression mit GZipStream.

Es passiert, wenn ich versuche (65, 90) statt (256, 65536), also ich vermute, es hat etwas mit Unicode zu tun. Ich habe CurrentCulture und überhaupt keine Kultur anstelle von InvariantCulture ausprobiert und es schlägt immer noch fehl. Die resultierenden Zeichenfolgen scheinen jedoch identisch zu sein:

Assert.AreEqual fehlgeschlagen.

Erwartet:

< ☔ ฺ 疉鎷 얚 ᧏ 跨 꿌 沩 얫 嘹 ֨ ز 항 們嵜浮䑹 شم 靄  斳薃 픢 萁 ⯬ 쫎 ʛ⫕ 蝺 ꄗ 穌 넢  뇌 䶆멊 큀퉆  䐫 ̥ 괊 ⑆ 놸  僥 ̅ᵀ 㣚 ꢅ 뺓 䇚 녚 伀讍 홬 䈕 캾 撏 Ჴ 孢黮摠 뮡  䌦 윃 ᬳ 狚䆙 툾훶 䏤 ꛈṻ⟧㉖鮸蒵萗 냤 퇅서 㪨瀲鰪残䓴 ۇ 넃 櫜㑦䢻 쮓죣 䕱䶘㴝姳 뿝 嘼 ᷨ 㗬 꺬  櫣涷 ꠶ 浒 껅 က 㷕䩉  毎覛 ⧹ 䮯嬇 힚 艐 Ὑ 쇕횻 鸙蹻硐  䈆 쓖 ⸛ 錼鰙 ኰ乒 ֐ ⺴ 썓힠 䵓 ꅄ ⵈ 桃桃枟枟 ⏠ ⏠  琖琖琖琖琖㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿ㅞ ⤩ 㥍車䎘磛磛蚾 ㅸ 떦 蝳蝳奪奪奪奪奪奪奪奪奪奪奪奪奪奪奪硼佑烑䳘 핬 溴墽炁炁 ࣘ ࣘ 䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝! ⩏￸ 鍁 Ꮨ䷇ 쁐쨒 ʊ 쪦 鄭借滋铆 ᮉ 嚃 ᩨ⶝ ိ  펇 ꮼ 뇄 』ᰉ 㕾枒鯅蛺  䠿櫄築 픆 车 똅렬 ㈆ّ Ἃ 荞 괋  랆 偦 뤰 䝷 핸 ⹝ 屑素蝨怀猔勛碉睹睹 Ⓥ Ⓥ ಗ    뾿 䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗跠﨔膉邘 ⋫ 吪 멚 埣埣 ꯕ ꯕ 谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲谲䕱遲䩢䩢 뭯 뭯 䬾 갭 갭 䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱.

Aktuell:

< ☔ ฺ 疉鎷 얚 ᧏ 跨 꿌 沩 얫 嘹 ֨ ز 항 們嵜浮䑹 شم 靄  斳薃 픢 萁 ⯬ 쫎 ʛ⫕ 蝺 ꄗ 穌 넢  뇌 䶆멊 큀퉆  䐫 ̥ 괊 ⑆ 놸  僥 ̅ᵀ 㣚 ꢅ 뺓 䇚 녚 伀讍 홬 䈕 캾 撏 Ჴ 孢黮摠 뮡  䌦 윃 ᬳ 狚䆙 툾훶 䏤 ꛈṻ⟧㉖鮸蒵萗 냤 퇅서 㪨瀲鰪残䓴 ۇ 넃 櫜㑦䢻 쮓죣 䕱䶘㴝姳 뿝 嘼 ᷨ 㗬 꺬  櫣涷 ꠶ 浒 껅 က 㷕䩉  毎覛 ⧹ 䮯嬇 힚 艐 Ὑ 쇕횻 鸙蹻硐  䈆 쓖 ⸛ 錼鰙 ኰ乒 ֐ ⺴ 썓힠 䵓 ꅄ ⵈ 桃桃枟枟 ⏠ ⏠  琖琖琖琖琖㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿㪿ㅞ ⤩ 㥍車䎘磛蚾蚾 ㅸ ㅸ 蝳蝳騑騑騑騑騑騑騑騑騑騑騑騑騑騑騑硼佑烑䳘 핬 溴墽炁炁 ࣘ ࣘ 䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝䚝! ⩏￸ 鍁 Ꮨ䷇ 쁐쨒 ʊ 쪦 鄭借滋铆 ᮉ 嚃 ᩨ⶝ ိ  펇 ꮼ 뇄 』ᰉ 㕾枒鯅蛺  䠿櫄築 픆 车 똅렬 ㈆ّ Ἃ 荞 괋  랆 偦 뤰 䝷 핸 ⹝ 屑素蝨怀猔勛碉睹睹 Ⓥ Ⓥ ಗ    뾿 䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗䦗跠﨔膉痹邘 ⋫ 吪 멚 埣 ꯕ 扌 옘 广  犵肖街  㶕畅 몡 ↇ꠫ 襤 픧 ၥ 帻 놤 ਰ 惘 똞 颤糴 쫼 鿋 䬝穫  ⺁峁踷锝  副鰀嗊 ⹀ 谲䕱遲䩢䩢 뭯 뭯 䬾 갭 갭 䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱䕱.

Was fehlt mir?

Quelle

2009-05-25 Serhat Ozgel

Wow. Es ist mir definitiv nicht klar, ob diese beiden Saiten auf einen Blick gleich sind oder nicht. –

Welche AreEqual schlägt fehl? –

@Stefan, der zweite. –

(char)(r.Next(256, 65536)) können ungültige Zeichenkombinationen erzeugen, die zu illegalem Text führen, sodass Sie sie nicht zum Erstellen von Testinhalten verwenden können. Dies kann auch dann passieren, wenn der Cast gültig ist und ein gültiges Zeichen erzeugt wird. Ein Beispiel sind Surrogate in U + D800 bis U + DFFF, aber wahrscheinlich gibt es andere.

Wenn Sie Beispieltext aus allen Unicode-Bereichen generieren möchten, müssen Sie bei der Erstellung Unicode beachten und nicht nur zufällig nach char. (Ich glaube, Sie auf diese treffen, wenn Sie in der Frage festgestellt, dass es funktioniert, wenn Sie einen engen Bereich für die Zufallszahl geliefert.)

Quelle

2009-05-25 15:31:01 bzlm

Sie haben recht, als ich einige handgefertigte Figuren benutzte, funktionierte es. Vielen Dank. –

Ich bin nicht überzeugt !!! "(char) (r.Next (256, 65536)) kann ungültige Zeichen erzeugen". Wie ist das? Sie können jedes int in diesem Bereich in ein Unicode-Zeichen umwandeln, wie die * char * -Dokumente sagen (U + 0000 bis U + ffff -> Unicode 16-Bit-Zeichen) –

@bruno Vermeiden Sie einfach den Bereich U + 55296 bis U + 57343 Fall. – hoang

Verwenden Sie byte nicht char.

Ihre Compress/Decompress Methoden sollten ein byte[] Array nehmen, und was auch immer sie anruft sollten Ihre Unicode-Daten lesen und übersetzen, bevor Sie sie aufrufen.

Sie wissen, dass ab .NET 2.0 die Klasse GZipStream?

Quelle

2009-05-25 15:27:54

Wie Sie bemerken werden, verwende ich Char-Array nur zum Initialisieren der Zeichenfolge. Komprimierungs- und Dekomprimierungsmethoden funktionieren niemals mit Zeichen. Sie verwenden intern Bytearrays. –

Text ist char [], nicht Byte []. Byte [] sollte nur * intern * verwendet werden. Also stimme ich nicht zu, dass es in der Testmethode verwendet werden sollte. – bzlm

@buyutec: Da wir Ihre Implementierung dieser Methoden nicht sehen können, ist es ein bisschen schwer zu sagen, dass sie Byte-Arrays intern verwenden ... –

einige Experimente gemacht:

string testString = new String(testArray); 
string anotherString = new String(testArray); 
Assert.AreEqual(testString.Length, anotherString.Length); 
Assert.AreEqual(testString, anotherString, false, CultureInfo.InvariantCulture);

Dies ohne Kompression ist. Es funktioniert gut.

Ich schlage vor, Sie Ihren Test, dies zu ändern:

for (int i = 256; i < 65536; i++) 
{ 
    string testString = new String((char)(i), 2); 

    string compressed = compressor.Compress(testString); 
    string decompressed = compressor.Decompress(compressed); 

    Assert.AreEqual(testString.Length, decompressed.Length); 
    Assert.AreEqual(testString, decompressed, false, CultureInfo.InvariantCulture); 
}

Diese Tests genau ein Zeichen in einer Zeit, Sie haben keine Zufallswerte (kein „manchmal Werk“ Problem) und Sie werden sehen, ob es eine bestimmte Art von Zeichen gibt, die nicht funktioniert.

Quelle

2009-05-25 15:47:01

Ich habe den gleichen Test für die Verschlüsselung/Entschlüsselung.

Dichotomie Verwendung habe ich festgestellt, dass jede Zeichenfolge „Surrogates Codepunkte“ enthält, die im Unicode-Zeichen Bereich U + 55296 bis U + 57343 wird unter Verwendung von nicht Assert.AreEqual

so die breitesten Bereiche Sie verwenden können, sind:

char randomChar = (char)(r.Next(0, 55295));

und

char randomChar = (char)(r.Next(57344, 65535));

Quelle

2011-09-28 12:06:06 hoang

Assert.AreEqual schlägt fehl, auch wenn erwartet und tatsächlich sind die gleichen

Antwort

Verwandte Themen