-2

Ich beginne mit der Entwicklung einer Software, in der durch ein Bild von einem touristischen Ort (zum Beispiel: Basilika San Pietro, das Kolosseum, etc.) sollte ich den Namen der Spot (und die zugehörigen Informationen). Zusätzlich zu dem Bild werde ich die Bildkoordinaten (eingebettet als Metadaten) mit mir haben. Ich weiß, dass ich mich mit Google Images API unterstützen kann, indem ich die umgekehrte Suche verwende, in der ich mein Bild als Eingabe gebe, und ich werde als Antwort eine große Menge von Bildern haben.Information Retrieval Get place name by image

Allerdings ist mein Rat für Sie, ist, dass jetzt mit allen ähnlichen Bildern, die ich machen kann, um den korrekten Ortsnamen, der auf dem Foto ist, zu erreichen. Ein zweiter Ansatz, den ich verwalte, besteht darin, mein eigenes Dataset in meiner Datenbank zu konstruieren und meine eigene Heuristik zu machen (Bilder nach ihrer Position zu filtern und dann die Vergleiche über die resultierende Teilmenge durchzuführen, nachdem diese Filterung durchgeführt wurde). Anregungen und Ratschläge sind zu hören, und danke im Voraus.

Antwort

0

Eine Idee besteht darin, die Bildunterschriften (falls verfügbar) als Abfrage zu verwenden, eine Liste von Kandidaten abzurufen und eine strukturierte Wissensbasis zu verwenden, um den Standortnamen abzuleiten.

Die Situation ist wesentlich komplizierter, wenn den Bildern keine Bildunterschriften zugeordnet sind. In diesem Fall können Sie die fc7-Layer-Ausgabe eines vortrainierten Faltungsnetzes verwenden und in das ImageNet abfragen, um eine Rangliste zu erhalten Bilder. Da diese Bilder Untertitel haben, können Sie sie erneut verwenden, um den Standortnamen zu erhalten.