0

Was ist anisotrope Skalierung? Und wie wird es bei Bildverarbeitung und Computer Vision erreicht?Was ist anisotrope Skalierung in Computer Vision?

Ich verstehe, dass es eine Form von non-uniform scaling ist, wie Wikipedia es ausdrückt, aber ich verstehe immer noch nicht gut, was es bedeutet, wenn es auf Bilder angewendet wird. In jüngster Zeit werden auch einige Deep-Learning-Architekturen wie R-CNN zur Objekterkennung verwendet, die jedoch wenig zu diesem Thema zeigen.

Alle Beispiele und visuellen Abbildungen, die das Konzept klar erklären, wären wirklich nett.

+1

Ich habe keine Domänenkenntnisse, aber sprachlich "anisotrop" und "nicht einheitlich" sind auch. Auf dieser Grundlage stelle ich mir eine lineare Transformation vor, die durch eine diagonale Matrix definiert wird, deren Diagonalen ungleich sind. Etwas allgemeiner würde ich annehmen, dass es sich um eine lineare Transformation mit zwei senkrechten Eigenvektoren und zwei nicht gleichen Eigenwerten handelt. –

Antwort

0

Ungleichmäßige Skalierung bedeutet nur, dass auf jede Dimension unterschiedliche Maßstäbe angewendet werden, wodurch sie anisotrop werden. Das Gegenteil wäre eine isotrope Skalierung, bei der die gleiche Skalierung auf jede Dimension angewendet wird.

Im Kontext von R-CNN haben die Autoren einen Trick gemacht, Bilder mit variabler Größe mit dem Klassifikationsnetzwerk zu verwenden, sie skalieren jedes Bild in eine feste Größe (ich glaube, es war 224x224), und dies geschieht unabhängig von der Seitenverhältnis des Bildes. Also sagen Sie, Sie haben ein 1280x720 Bild, und wenn es auf 224x244 verkleinert wird, dann sind die Skalen 1280/224 und 720/224, die offensichtlich nicht die gleichen sind, daher anisotrope Skalierung.

Verwandte Themen