Ich habe ein Bild mit 3 Objekten in ihnen: ein Auto, ein Fahrrad und ein Hund. Kann der Beutel mit Wörtern so implementiert werden, dass er alle drei in einem Bild trennt und erkennt?Können Wörter in einer Tasche für die Klassifizierung mehrerer Objekte in einem Bild verwendet werden?
0
A
Antwort
0
Tasche von Visual Word ist nur eine Methode, um Features neu darzustellen. Diese neuen Repräsentationen können durch Verwendung einer der Pooling-Techniken kombiniert werden. Nun, wenn Sie mehrere Objekte im Bild haben, sollte dies in der neuen Darstellung des Bildes "die Ausgabe des Pooling" codiert werden. Das Erkennen dieser Objekte ist die Arbeit des Multi-Label-Klassifikators.
Beachten Sie, dass sich die spärliche Codierung als besser als BoW erwiesen hat. Mit der Sparse-Codierung können Sie den auf Sparse basierenden Klassifikator verwenden, um das Auftreten mehrerer Objekte zu erkennen. Der spärlich basierte Klassifikator analysiert die Seltenheit verschiedener Bereiche der spärlichen Repräsentation, um die Objekte im Bild zu finden
Verwandte Themen
- 1. Kann Caffe Only ohne Klassifizierung für die Klassifizierung verwendet werden?
- 2. Zusammenführen mehrerer Objekte, die gleiche ID verwendet
- 3. Speichern mehrerer Objekte in einer HDFStore-Gruppe
- 4. Bild als Bezeichnung für die pixelweise Klassifizierung mit lmdb
- 5. Wird die SVM-Klassifizierung nur für die Klassifizierung von Datensätzen mit nur 2 Labels verwendet?
- 6. Wie können Ressourcen geschützt werden, die in einer Multithread- oder asynchronen Umgebung verwendet werden können?
- 7. Theoretische Grenze für die Anzahl der Schlüssel (Objekte), die in einer HashMap gespeichert werden können?
- 8. Erstellen mehrerer Objekte in Schleife
- 9. Wie können Rückrufe in einer has_many durch Assoziation verwendet werden?
- 10. Zeichenklassen, die in ffi-aspell verwendet werden
- 11. Wie können% -Zeichen in Bezeichnern verwendet werden
- 12. System.Web.HttpException: Mehrere Objekte können nicht in einer DropDownList ausgewählt werden
- 13. Können mehrere Filter in einer Datenquelle verwendet werden?
- 14. SVM für Bild Feature-Klassifizierung mit OpenCv
- 15. Objekte können nicht in AppBar ausgerichtet werden
- 16. können wir Set, Tasche, Karte für nicht Sammlung Beziehung verwenden
- 17. Können F # TypeProvider in einer Windows Store App verwendet werden?
- 18. Regex-Übereinstimmung für den Anfang mehrerer Wörter in Zeichenfolge
- 19. SVM-Klassifizierung für mehrere Klassen in Encog
- 20. Können private Setter in einem Entitätsmodell verwendet werden?
- 21. Können Deklarative Services in einem Thread verwendet werden?
- 22. Wie können Namen in einem echoed HTML-Tags verwendet werden
- 23. Können Variablen in ElasticSearch-Indexvorlagen verwendet werden?
- 24. Können virtuelle Funktionen in Rückgabewerten verwendet werden?
- 25. Wie können Knotenumgebungsvariablen in Gulp verwendet werden?
- 26. Wie können Kommentare in Lenkervorlagen verwendet werden?
- 27. Testen mehrerer Wörter mit Adobe Javascript
- 28. Können Kurzwahlnummern in einer Static WordPress Homepage verwendet werden?
- 29. Können dust.js-Vorlagen in einer CouchDB "show" -Funktion verwendet werden?
- 30. Wie können die Abhängigkeiten zwischen Postbacks in einer Webanwendung, die Unity verwendet, beibehalten werden?
Unter Verwendung von BoW sollte die oben erwähnte Darstellung des Bildes sein, da BoW ein Histogramm erstellt, das das gesamte Bild anstatt die einzelnen Objekte. Und was sind die Pooling-Techniken, auf die Sie sich beziehen? –
Pooling-Techniken können max., Durchschnitt ..etc Pooling sein. Die neuen Darstellungen sind die Codes, die entweder aus der Verwendung von BoW oder einer spärlichen Codierung resultieren. – BH85