Ich habe eine Abfrage für die Anzeige potenzieller Duplikate aus einer Liste von Telefonbucheinträgen mit dem gleichen Vorname, Nachname. Der Benutzer ist dann in der Lage, verdächtige Duplikate nach der Überprüfung weiterer Metadaten zusammenzuführen.Kennzeichnung möglicher Duplikate als unterschiedliche
Was ich nicht ganz ausarbeiten kann, ist, wie man Paare als unterschiedliche und nicht als Duplikate kennzeichnen kann.
Ich wollte eine Tabelle erstellen, die Paare auflistet, die keine Duplikate sind, aber ich kann keine Möglichkeit finden, diese aus der generierten Liste verdächtiger Duplikate auszuschließen. Die SQL für die Liste ist unten. Ich fragte mich, ob ich das hier zurückgeben könnte, aber es war immer noch nicht ganz sicher, und ich fragte mich, ob jemand eine effiziente Lösung hat.
Ich mache das in MySQL und C#, aber die Prinzipien sollten für jede Sprache gelten.
Sind Sie auf der Suche nach linq gleichbedeutend mit obigen SQL-Abfrage? Wenn ja, geben Sie Ihre linq an, die Sie ausprobiert haben. – Viki888
Hallo viki888 danke für die Nachfrage und tut mir leid, das war nicht klar. Nein, ich habe mich nur gefragt, ob ich LINQ oder eine andere Methode verwenden sollte, um Paare auszuschließen, die nach der Erstellung der Liste der möglichen Duplikate nicht als Duplikate gekennzeichnet sind. – DuncanOppaz
Ich denke, das ist, was er fragt ... Sie haben zwei Personen in einer Datenbank (A und B), die den gleichen Namen haben. Das System denkt, dass es sich um dieselbe Person handelt (ein Duplikat), aber der Benutzer weiß, dass es sich um verschiedene Personen handelt, daher markiert er sie als einzigartig. Dann wird Person C zur Datenbank hinzugefügt, die wiederum denselben Namen hat. Das System sollte in der Lage sein, zu signalisieren, dass Person C ein Duplikat von A oder B sein könnte, aber auch wissen, dass A und B nicht dieselbe Person sind. – philwilks