Ich habe einige Modelle iterativ mit CNTK trainiert, wobei ich die Daten nach jeder Iteration durch einen neuen Satz ersetzt habe und dann eine weitere Trainingsrunde durchgeführt habe. Die .DNN-Dateien werden sowohl in CNTK selbst geladen (Ausführen des Befehls "Train"), als auch mit der CPU-Auswertung von C# mithilfe des Microsoft.Forschung.CNTK.CpuEval-mkl-Pakets nuget.Unbehandelte Ausnahme beim Laden eines gültigen Modells in CNTK
Die Auswertung des Modells dauert jetzt lange genug, dass ich entschied, auf die GPU-Bibliothek für C#, CNTK.GPU zu wechseln. Beim Versuch, das Modell in meinem Code zu laden, jedoch erhalte ich die folgende Ausnahme:
Prediction output operand's shape [7 x 1] is incompatible with label operand's shap [7] for the CrossEntropyWithSoftmax operation
at CNTK.Function.LoadModel(String modelFile)
Jede Idee, wie das Modell zu bekommen zu laden? Wenn ich die CNTK-Datei ändern muss, um die Topologie zu aktualisieren, kann ich das tun, aber ich würde es hassen, den Fortschritt, den ich mit den aktuellen Modellen gemacht habe, zu verwerfen.
Edit: Hier ist der Abschnitt der CNTK-Datei, die ich zum Aufbau des Netzwerks verwendet habe. Ich nahm im Wesentlichen Beispielcode und änderte es, um zu passen, was ich brauchte.
SimpleNetworkBuilder = {
layerSizes=84:5000*5:7
trainingCriterion="CrossEntropyWithSoftmax"
evalCriterion="ErrorPrediction"
layerTypes="RectifiedLinear"
initValueScale=1.0
uniformInit=true
needPrior=true
addDropoutNodes=true
}
Vielen Dank für die Meldung des Problems. Wir untersuchen es. –
Wenn es hilft, habe ich den Code zum Erstellen des Netzwerks hinzugefügt. –