2017-03-29 3 views
0

Ich praktiziere CNNs. Ich las einige Papiere über die Ausbildung MNIST Dataset CNNs.size des Bildes verwenden ist 28x28 und Architektur 5 Schichten verwenden: input> KONV1-maxpool1> CONV2-maxpool2> vollständig verbunden> AusgangÄndern Sie die Parameter in Convolution neuronalen Netzwerk

Convolutional Layer #1 
- Computes 32 features using a 5x5 filter with ReLU activation. 
- Padding is added to preserve width and height. 
- Input Tensor Shape: [batch_size, 28, 28, 1] 
- Output Tensor Shape: [batch_size, 28, 28, 32] 
Pooling Layer #1 
- First max pooling layer with a 2x2 filter and stride of 2 
- Input Tensor Shape: [batch_size, 28, 28, 32] 
- Output Tensor Shape: [batch_size, 14, 14, 32] 
Convolutional Layer #2 
- Computes 64 features using a 5x5 filter. 
- Padding is added to preserve width and height. 
- Input Tensor Shape: [batch_size, 14, 14, 32] 
- Output Tensor Shape: [batch_size, 14, 14, 64] 
Pooling Layer #2 
- Second max pooling layer with a 2x2 filter and stride of 2 
- Input Tensor Shape: [batch_size, 14, 14, 64] 
- Output Tensor Shape: [batch_size, 7, 7, 64] 
Flatten tensor into a batch of vectors 
- Input Tensor Shape: [batch_size, 7, 7, 64] 
- Output Tensor Shape: [batch_size, 7 * 7 * 64] 
Fully Connected Layer 
- Densely connected layer with 1024 neurons 
- Input Tensor Shape: [batch_size, 7 * 7 * 64] 
- Output Tensor Shape: [batch_size, 1024] Output layer 
- Input Tensor Shape: [batch_size, 1024] 
- Output Tensor Shape: [batch_size, 10] 

In KONV1 mit 1 Eingang computates 32 Features mit einem 5x5 Filter und in conv2 mit 32 Input von Conv1 berechnen 64 Features mit demselben Filter. Welche Parameter wie 32,64,2x2 Filter basieren auf? Basieren sie auf der Größe des Bildes?

Wenn die Größe der Bilder größer ist als 28x28 wie 128x128. Soll ich die Anzahl der Ebenen auf 5 Ebenen erhöhen? Wie ändern sich die obigen Parameter bei anderer Bildgröße?

Thank Voraus

Antwort

1

An es ist Basisebene, werden diese Eingänge genannt Hyper und werden typischerweise nicht durch eine bestimmte Reihe von Regeln definiert. Das heißt, oft verwenden wir Faustregeln (Heuristiken) einen Satz von Hyper Parametern zu wählen und dann Hyper Optimierung zur Leistungssteigerung oder Effizienz usw.

Eine große Erklärung hierfür ist Here

bearbeiten verwenden: Weitere Informationen in diesem Papier - es ist ein weit untersuchtes Problem, schauen Sie in Arxiv und Stats.Stackexchange für weitere Informationen, aber hier ist ein großes Papier, das ich beim Lernen Here

+0

Nach dem Lesen Ihrer Papiere habe ich noch nicht verstanden wie man einen Satz von Hyper-Parametern auswählt und sie ändert. Kannst du das klar erklären oder irgendwelche Papiere über sie haben? –

Verwandte Themen