Ich habe lange Liste von kurzen Strings, die ich komprimieren möchte, aber ich möchte jederzeit eine beliebige Zeichenfolge in der Liste dekomprimieren, ohne die gesamte Liste zu dekomprimieren.komprimieren lange Liste von kurzen Strings
Ich kenne die Liste im Voraus und es spielt keine Rolle, wie viel Vorverarbeitung ist beteiligt. Es ist auch in Ordnung, wenn es einen signifikanten O (1) Speicher-Overhead gibt.
Ich weiß, dass ich jede Zeichenfolge unabhängig mit einem verlustfreien Komprimierungsalgorithmus komprimieren könnte, aber das wird nicht sehr gut funktionieren, da die Zeichenfolgen sehr kurz sind und nicht viel Redundanz enthalten. Auf der gesamten Liste gibt es jedoch eine Menge Redundanz.
Wie lange ist die Liste? Wie kurz sind die Strings? Wie viel komprimieren sie mit einem normalen Kompressor? –
@MarkAdler 2 Millionen Strings, durchschnittliche Größe 2k, ich bekomme ~ 35% Kompressionsrate mit gzip –