Ich habe verschiedene Anbieter, die mir ein Excel mit verschiedenen Städten geben, in jeder Stadt verwenden sie einen speziellen Code für ihre Operationen und mehr Daten, die für mein Geschäft nützlich sind.Städte aus verschiedenen Quellen identifizieren und in Beziehung setzen
Das Problem ist, dass ich ein Chaos mit all diesen Städten habe:
- ich meine eigenen Städte in meiner Datenbank, um 9000 Datensätze.
- Provider A gibt mir seine Excel oder webservice zu bekommen um 6000.
- Provider B mir ein anderes C 5000.
- Provider gibt ... etc
Einige der von meinem Provider gegeben Städte bereits in meiner Datenbank und ich muss nur die erforderlichen Daten aktualisieren, die ich brauche.
Ansonsten muss ich diese neue Stadt in meine Datenbank einfügen.
Und dies, jedes Mal, wenn ein Anbieter mir ein Update dieser Städte gibt.
Nun, das Hauptproblem ist, dass ich eine Stadt anders als sie anrufen, und sie unterschiedlich voneinander ... wie zu wissen, ob ich bereits diese Stadt habe oder ich muss ein neues erstellen, da wir verwenden verschiedene Namen?
So wie ich es sehe, kann ich es nur manuell erreichen. Vergleichen ihrer Städte mit Minen.
Natürlich ist es zu viel Arbeit, also habe ich mein eigenes Skript gemacht, und die Levehnstein Funktion für die Datenbank implementierend, kann ich automatisch die übereinstimmenderen sehen und sie durch einen Klick auswählen. Das Skript erledigt den Rest (aktualisiert ihren speziellen Operationscode für diese Stadt in meine entsprechende Stadt, die in meiner Datenbank gespeichert ist).
Auch damit habe ich immer noch das Gefühl, dass mir etwas fehlt. Wenn es für diese Städte einen Unicode gäbe, wäre das viel einfacher und automatischer, aber ich habe keinen Code, der diese Städte mehr identifiziert als meine Tabellenkennung. Das gleiche gilt für meine Anbieter, trotz einiger der Verwendung, um mir die Postleitzahl unter den Städten zur Verfügung zu stellen, aber nicht alle.
Gibt es dafür eine bessere Lösung als meine? Irgendwelche universellen Code, den Sie normalerweise verwenden, oder irgendeine andere Approach?
Bearbeiten: Nun, jede Stadt gehört zu einem Land. Natürlich denke ich darüber nach.
In meiner Stadt Tabelle habe ich eine ID für jedes Ziel, und dann eine Spalte für den Operationscode jedes Anbieters (ich weiß, das könnte besser mit einer Beziehung mehr dargestellt werden), plus Ländercode, zip, URL für seo ...
Respektierung der Lösung von MagnusL erwähnt, ein Synonym Tabelle erstellen, warum sollte ich die Synonyme speichern müssen? das Skript in Bezug auf Sie mit levehnstein und menschlicher Interaktion erwähnt, das ist genau das, was ich derzeit tue:
Mit jedem Datensatz von einem Anbieter und meine Ziele Tabelle. Angesichts eines Providerstadt-Eintrags zeige ich die übereinstimmenderen von meinem Tisch.
Aber zuvor verknüpfe ich automatisch alle diejenigen, die in Postleitzahl und Land übereinstimmen.
Es ist eine Menge Arbeit, um den speziellen Betriebscode meines Providers für jede Stadt zu aktualisieren. Ich bin nur neugierig darauf, wie Leute mit diesem Problem umgehen, ich bin mir sicher, dass sich viele Entwickler irgendwann damit auseinandersetzen müssen.
Wie viele Anbieter haben und haben sie immer den gleichen Namen für Stadt oder es gibt keine Regel? Zum Beispiel, gibt ein Anbieter für "Chicago" immer "CHICAGO" oder kann es "Chicago" oder etwas Ähnliches sein? Ich denke, dass Sie vielleicht eine interne "KI" schaffen könnten, die rechtzeitig lernen wird, indem Sie Informationen für jeden Anbieter zuordnen. – Vladan
Sind alle Ihre Städte aus einem einzigen Land? Sind die Unterschiede in Städten aufgrund von Schreibweisen, Rechtschreibfehlern oder anderen Sprachen anders? –
@FrancisEytanDortort Nein, um die ganze Welt. Ja, verschiedene Schreibweisen, Rechtschreibfehler und sogar Sprachen. – vivoconunxino