Antwort

5

Der Schritt definiert, wie der Filter entlang des Eingangsbildes (Tensor) bewegt wird. Nichts hält Sie davon ab, entlang unterschiedlicher Achsen unterschiedlich zu schreiten, z. B. stride=[1, 2] bedeutet, dass 1px gleichzeitig entlang der Achse 0 und 2px entlang der Achse 1 bewegt werden. Diese besondere Kombination ist nicht üblich, aber möglich.

Die Tensorflow-API geht noch weiter und ermöglicht benutzerdefiniertes Schreiten für alle Achsen des 4D-Eingangstensors (siehe tf.nn.conv2d). Mit dieser API ist es nicht ungewöhnlich, strides=[1, 2, 2, 1] zu setzen, was durchaus Sinn macht: Es sollte jedes Bild (das erste 1) und jeden Eingangskanal (das letzte 1) verarbeiten, aber gelten 2x2 schreiten der räumlichen Dimensionen. Soweit die Faltung betroffen ist, ist die Operation anwendbar für jede strides Array, aber nicht Werte sind gleichermaßen nützlich.

Sehr empfehlen this CS231n tutorial für weitere Details zu diesem Thema.