2016-03-26 5 views

Antwort

0

Tasche von Visual Word ist nur eine Methode, um Features neu darzustellen. Diese neuen Repräsentationen können durch Verwendung einer der Pooling-Techniken kombiniert werden. Nun, wenn Sie mehrere Objekte im Bild haben, sollte dies in der neuen Darstellung des Bildes "die Ausgabe des Pooling" codiert werden. Das Erkennen dieser Objekte ist die Arbeit des Multi-Label-Klassifikators.

Beachten Sie, dass sich die spärliche Codierung als besser als BoW erwiesen hat. Mit der Sparse-Codierung können Sie den auf Sparse basierenden Klassifikator verwenden, um das Auftreten mehrerer Objekte zu erkennen. Der spärlich basierte Klassifikator analysiert die Seltenheit verschiedener Bereiche der spärlichen Repräsentation, um die Objekte im Bild zu finden

+1

Unter Verwendung von BoW sollte die oben erwähnte Darstellung des Bildes sein, da BoW ein Histogramm erstellt, das das gesamte Bild anstatt die einzelnen Objekte. Und was sind die Pooling-Techniken, auf die Sie sich beziehen? –

+0

Pooling-Techniken können max., Durchschnitt ..etc Pooling sein. Die neuen Darstellungen sind die Codes, die entweder aus der Verwendung von BoW oder einer spärlichen Codierung resultieren. – BH85

Verwandte Themen