allererst mich mit den Worten beginnen zu lassen, dass ich this question.Erläuterung zu HyperLogLog Algorithmus
So las, wie ich über das Internet schlendere und ich kam in diesem Algorithmus und ich frage mich, wie es funktioniert. Nachdem ich darüber gelesen hatte, verstand ich, wie es die Ansichten durch Hashing und Verwendung von Bits zählt.
Was ich noch nicht ganz verstehe, ist, wie man sicher vermeiden kann, die gleiche Ansicht wieder zu zählen. Speichern wir jeden Hash-Wert, den wir finden, und bevor wir den Zählungs-Check inkrementieren, wenn er bereits in unserem Array existiert oder was auch immer?
Macht das nicht viel weniger effizient, wenn wir 1000k + Elemente haben?