2016-07-20 1 views
0

Ich kann Scikit-Learn verwenden, um ein Modell zu trainieren und Objekte zu erkennen, aber ich muss auch in der Lage sein zu sagen, wo sich in meinen Testdaten das Objekt befindet. Könnte ich vielleicht die Koordinaten des Teils des Testbildes bekommen, der das Objekt hat, das ich zu erkennen versuche?Wie kann ich die Position eines identifizierten Objekts in Scikit-Learn ermitteln?

Wenn nicht, bitte verweisen Sie mich auf eine andere Bibliothek, die mir dabei helfen wird, diese Aufgabe zu erfüllen.

Thankyou

Antwort

0

Ich gehe davon aus, dass Sie über einen Computer Vision Anwendung sprechen. Normalerweise besteht die Art und Weise, wie eine Box um ein identifiziertes Objekt gezeichnet wird, darin, dass Sie ein gleitendes Fenster verwenden und Ihren Klassifikator in jedem Fenster ausführen, während es über den Bildschirm läuft. Sie können verfolgen, welche Fenster mit positiven Ergebnissen zurückkommen und diese Fenster als Ihre Grenzen verwenden. Vielleicht möchten Sie Fenster verschiedener Größe verwenden, wenn sich der Objektmaßstab von Bild zu Bild ändert. In diesem Fall würden Sie wahrscheinlich das kleinere von zwei überlappenden Fenstern bevorzugen.

+0

Danke für die Antwort! Also habe ich Objekte mit SciKit-Learn erkannt. Ich habe den SIFT-Deskriptor für Feature-Erkennung und die Bag-Of-Words-Technik verwendet, um mein Ziel zu erreichen. Mein Programm ist sehr erfolgreich in der Lage, das Objekt zu erkennen. Jetzt müssen Sie nur noch ein begrenzendes Rechteck um es herum erstellen. Die Technik, die Sie erwähnt haben, macht hier keinen Sinn, weil SIFT unabhängig vom Maßstab ist und ein gleitendes Fenster nur zur Berechnung beiträgt, nein? Könnte ich vielleicht OpenCV und einige CV-Techniken verwenden, um das Objekt zu lokalisieren? – legolasshegolas

Verwandte Themen