Ich würde gerne wissen, wenn Kompressionsalgorithmen immer eine eindeutige Ausgabe für zwei verschiedene Sätze von Dateien generieren.Können Komprimierungsalgorithmen eine identische Ausgabe für zwei verschiedene Dateien erzeugen?
Angenommen, ich habe zwei Dateien A und B und sage, dass ich für jede dieser Dateien einen Komprimierungsalgorithmus verwende (zum Beispiel PKZIP - dies könnte jeder Komprimierungsalgorithmus sein), um A.zip bzw. B.zip zu erhalten . Ist es möglich, dass A.zip für eine Kombination von A und B genau identisch mit B.zip auf der binären Ebene ist. Wenn dies nicht möglich ist, können wir sicher annehmen, dass die Komprimierung dem kryptografischen Hashing entspricht, wenn es um die Gewährleistung von Eindeutigkeiten geht ? Auf der anderen Seite, wenn es möglich ist, könnten Sie mir bitte eine Probe A und B-Datei zusammen mit dem Kompressionsalgorithmus zur Verfügung stellen, um diese Duplizität zu überprüfen?
Ihre Erwähnung von "kryptographischem Hashing" hat einige Leute dazu gebracht zu glauben, dass Sie verlustfreie Komprimierung für Sicherheitszwecke verwenden wollen - ist das richtig? Wenn das so ist, ist das eine schreckliche Idee, aus all den Gründen, die sie geben. Aber wenn Sie nur daran interessiert sind, die Eindeutigkeit zu garantieren, und bereit sind, mit den Ausgaben variabler Länge umzugehen, die Ihnen die Komprimierung bietet, dann ist das eine vernünftige Wahl (obwohl für alle praktischen Zwecke die Verwendung eines kryptografischen Hashes mit fester Länge schneller und einfacher ist) gut funktionieren - die Wahrscheinlichkeit einer Schlüsselkollision mit zB 128-Bit-Schlüsseln ist unerheblich. –