Können Wörter in einer Tasche für die Klassifizierung mehrerer Objekte in einem Bild verwendet werden?

Ich habe ein Bild mit 3 Objekten in ihnen: ein Auto, ein Fahrrad und ein Hund. Kann der Beutel mit Wörtern so implementiert werden, dass er alle drei in einem Bild trennt und erkennt?Können Wörter in einer Tasche für die Klassifizierung mehrerer Objekte in einem Bild verwendet werden?

Quelle

2016-03-26 karan ahuja

Tasche von Visual Word ist nur eine Methode, um Features neu darzustellen. Diese neuen Repräsentationen können durch Verwendung einer der Pooling-Techniken kombiniert werden. Nun, wenn Sie mehrere Objekte im Bild haben, sollte dies in der neuen Darstellung des Bildes "die Ausgabe des Pooling" codiert werden. Das Erkennen dieser Objekte ist die Arbeit des Multi-Label-Klassifikators.

Beachten Sie, dass sich die spärliche Codierung als besser als BoW erwiesen hat. Mit der Sparse-Codierung können Sie den auf Sparse basierenden Klassifikator verwenden, um das Auftreten mehrerer Objekte zu erkennen. Der spärlich basierte Klassifikator analysiert die Seltenheit verschiedener Bereiche der spärlichen Repräsentation, um die Objekte im Bild zu finden

Quelle

2016-04-01 14:19:55 BH85

Unter Verwendung von BoW sollte die oben erwähnte Darstellung des Bildes sein, da BoW ein Histogramm erstellt, das das gesamte Bild anstatt die einzelnen Objekte. Und was sind die Pooling-Techniken, auf die Sie sich beziehen? –

Pooling-Techniken können max., Durchschnitt ..etc Pooling sein. Die neuen Darstellungen sind die Codes, die entweder aus der Verwendung von BoW oder einer spärlichen Codierung resultieren. – BH85

Können Wörter in einer Tasche für die Klassifizierung mehrerer Objekte in einem Bild verwendet werden?

Antwort

Verwandte Themen