Ich habe ein Startprojekt und es geht um Dateien. Ich habe versucht, einen Algorithmus zu erstellen, aber ich konnte nicht. Ich möchte einen Algorithmus zusammen mit einer Datenbank für diese Zwecke erstellenVergleichen Sie eine Datei mit anderen Dateien, um herauszufinden, ob sie schon existiert oder nicht?
Ich habe viele Dateien in meiner Datenbank (Datei oder eine Beziehung zu Datei ist egal) und wenn eine andere Datei kommt, möchte ich diese Datei mit allen vergleichen Meine Dateien und wenn es mehr als zum Beispiel 80% Ähnlichkeit hat, lasse ich das nicht in meiner Datenbank anders mit dieser Bedingung speichern, dass es weniger als 80% Ähnlichkeit mit allen Dateien hat, die ich in meiner Datenbank speichern möchte.
Ähnlichkeit definieren: Bytefolgen, Wörter? Dateitypen unterstützen? ohne Code ist dies hier nicht möglich. – dlatikay
@dlatikay lieber Freund i Problem mit einer Datei mit vielen vergleicht es braucht Zeit meine Dateien bleiben nicht Typ Datei ich will in allen Dateitypen aus, sondern speziell pdf und docx –
Sie könnten wollen, betrachten [ nahe Dublettenerkennung] (http://stackoverflow.com/a/23053827/572670), scheint gut für Sie zu passen. – amit