Ich versuche, eine Software zu optimieren, die im Grunde genommen Millionen von Tests ausführt. Diese Tests werden so generiert, dass es einige Wiederholungen geben kann. Natürlich möchte ich keine Zeit damit verbringen Tests zu machen, die ich bereits ausgeführt habe, wenn ich es effizient vermeiden kann.Gegenteil von Bloom filter?
Also, ich denke über die Verwendung eines Bloom-Filters, um die Tests zu speichern, die bereits ausgeführt wurden. Allerdings irrt der Bloom-Filter auf der unsicheren Seite für mich. Es gibt falsche Positive. Das heißt, es kann berichten, dass ich einen Test durchgeführt habe, den ich nicht gemacht habe. Obwohl dies in dem Szenario, an dem ich gerade arbeite, akzeptabel sein könnte, habe ich mich gefragt, ob es einen äquivalenten Bloom-Filter gibt, aber auf der anderen Seite irrte, das heißt, nur falsche Negative zu geben.
Ich habe die Literatur ohne Glück überflogen.
http://cstheory.stackexchange.com/questions/6596/a-probabilistic-set-with-no-false-positives –
Für Vollständigkeit, dies von Interesse sein könnten: https://github.com/ jmhodges/conversed_of_a_bloom_filter – Dave
Es gibt eine solche Sache mit dem lustigen Namen "Gegenteil von einem Bloom Filter". Code: https://github.com/jmhodges/opposite_of_a_bloom_filter blog: http://www.somethingsimilar.com/2012/05/21/the-opposite-of-a-bloom-filter/ – ib84