-4

Ich möchte einige Objekterkennung wo zwei Einschränkungen haben.Deep Convolutional Networks

Die erste ist, dass ich im Moment keine große Anzahl von Bildern für das Training habe (im Moment sind es etwa 550 Bilder).

Zweitens, höchstwahrscheinlich werde ich nicht in der Lage sein, das ganze Objekt zu sehen, es wird nur ein Teil des Objekts verfügbar sein, das ich zu erkennen versuche.

Meine Frage ist es gut, Deep Convolutional Networks über Bayesian Optimierung und strukturierte Vorhersage für diese Art von Situation zu versuchen?

Ich habe dieses Papier als Referenz: Deep Convolutional Networks via Bayesian Optimization and Structured Prediction.

+1

Bitte lesen Sie erneut https://StackOverflow.com/Help/on-Topic –

+0

Das explizite Fragen nach Empfehlungen für externe Ressourcen (Bücher, Tutorien, Beispiele, Bibliotheken) ist explizit hier von Thema (wegen vielen Gründen). Ich habe diesen Teil Ihrer Frage entfernt und die Tags geändert, da die Frage selbst wahrscheinlich von jemandem zu beantworten ist, der weiß, um was es sich handelt. – hyde

+0

Was ist mit einigen Tutorials oder Codebeispielen von CNN, wo gefunden werden kann? – user3035413

Antwort

1

Sie müssen uns mehr Details anbieten. Die Antwort auf was CNN sollte ich verwenden? und habe ich genug bilder dafür? hängt von mehreren Faktoren ab:

1- Wie viele Objekte für 550 Bilder? Jedes Objekt ist eine Klasse, wenn Sie 550 Bilder von 2 verschiedenen Objekten haben, die ausreichen könnten, aber wenn Sie 550 Objekte haben, ist das nur 1 Bild pro Objekt, was definitiv nicht genug ist.

2- Wie groß sind Ihre Bilder? Ändert sich das unter ihnen? Die 550 Bilder enthalten Teile des Objekts oder des gesamten Objekts?

Nachdem Sie die Antwort auf diese Fragen kennen, können Sie Ihre CNNs-Architektur und Ihre Datenerweiterungsstrategie auswählen.

Strukturierte rezeptive Felder haben bessere Ergebnisse für kleine Datensätze als das normale CNN gezeigt. Hier ist eine Papiere dazu: https://arxiv.org/abs/1605.02971

+0

Ich versuche, die Flugzeugtür aus einer Entfernung von 2 m von der Aerobrücke zu erkennen. 1. Das Bild enthält also einen Teil der Tür (mit einigen Merkmalen wie z. B. Türrahmenlinien, einen Teil des Fensters oder Türgriffs) und andere Objekte im Flugzeug (wie andere Fenster oder einige Logos oder Teile der Tür) Flugzeugparklinien). 2. Das Bild kann in der Größe verändert werden, um die Berechnung zu verringern. Die kürzere Seite kann auf 600 Pixel verkleinert werden. Mehrskalige Bildeingaben können die Leistung verbessern. Unter Berücksichtigung der Rechenzeit kann nur ein Bildmaßstab in dem System verwendet werden. Ist es jetzt klarer? – user3035413

+0

Also alle deine 550 Bilder sind Bilder von Flugzeugtüren und du willst sie richtig identifizieren? Es ist ein 1-Klassen-Problem? Ist es möglich, dass keine Türen in den Bildern sind? –

+0

nein. in allen 550 Bildern sind Flugzeugtür und andere Objekte wie ich schon sagte. in einem Bild kann ein Teil der Flugzeug-Tür, einige Flugzeug Fenster, dann Teil der Kabine oder was auch immer ist in diesem Flugzeug durch das Bild und einen Teil der Flughafen-Straße erfasst .. Die Bilder sind von Flugzeug-Docking-Prozess. Verstehen? – user3035413

Verwandte Themen