Ich bin auf der Suche nach einer leichten Java-Bibliothek, die Nearest Neighbor Searches nach Locality Sensitive Hashing für nahezu gleichverteilte Daten in einem hochdimensionalen (in meinem Fall 32) Dataset mit einigen hunderttausend Datenpunkten unterstützt.LSH-Bibliotheken in Java
Es ist völlig gut genug, um alle Einträge in einem Bucket für eine Abfrage zu erhalten. Was ich wirklich brauche, könnte dann unter Berücksichtigung einiger Filterparameter auf andere Weise verarbeitet werden.
Ich habe bereits likelike gefunden, hoffe aber, dass es etwas kleiner und ohne andere Werkzeuge (wie Apache Hadoop im Fall von likelike) gibt.
Haben Sie etwas gefunden? Ich habe das gleiche mit Euklidischer Entfernung als Metrik für kNN gesucht. –
Nicht wirklich. Aber ich denke, ich muss mir selbst eine Implementierung einfallen lassen. Die Frage ist jedoch immer noch, wie man gute Hash-Funktionen wählt ... – s1lence
Sie können mit der Hash-Funktion in der Matlab-Implementierung unter http://ttic.uchicago.edu/~gregory/download.html beginnen –