2017-04-08 3 views
1

Das * .cafemodel ist eine Ausgabe eines Netzwerks nach der Trainingsphase. Glauben Sie, dass seine Größe proportional zur Anzahl der Parameter ist? Das bedeutet, dass, wenn ich zwei Netzwerke A und B habe, das Netzwerk A in * .caffemodel mit der Größe 10MB auf der Platte resultiert, während Netzwerk B in einem * .caffemodel mit der Größe 20MB auf der Platte resultiert. Ist es richtig, wenn ich sagte, das Netzwerk A hat weniger lernbare Parameter als Netzwerk B?Ist die Größe des Caffemodells proportional zur Anzahl der Parameter?

+0

Ich denke nicht, dass das sicher gesagt werden kann. Das erste Modell könnte Gewicht mit Float-Werten und das zweite mit Double haben. – lnman

+0

es muss der gleiche Typ zu fairen Vergleich sein – user8264

Antwort

2

Nicht ganz. Die Größe hängt hauptsächlich von dem Speicher ab, der benötigt wird, um die Parameter und Gewichte zu speichern. Dies beinhaltet nicht nur die Menge jedes einzelnen, sondern auch die Datengröße. Wenn ein Modell so eingerichtet ist, dass es mit einer kurzen Festkommaarithmetik arbeitet, während ein anderes Modell normale Gleitkommazahlen verwendet, gibt es eine große Diskrepanz bei den Speicheranforderungen.

Auch Layer-Konnektivität hat viel mit der Dateigröße zu tun. Eine vollständig verbundene Schicht hat weit mehr Gewichte als eine Faltungsschicht, die die gleiche Anzahl von Parametern enthält.

Hilft das die Dinge ein wenig zu sortieren?

+0

. @ Prune - Das bedeutet, dass die Größe von '.caffemodel' ist immer unabhängig von der Iteration und Batch-Größe für das gegebene Netzwerk konstant? Ich beobachte, dass für 'AlexNet' mit einer beliebigen Anzahl von Iterationen oder Batch-Größen die Modelldatei für alle etwa 230 MB groß ist. –

+0

Rechts - für eine gegebene Topologie sollte jeder der Checkpoints die gleiche Größe haben, mit kleinen Abweichungen für die Beschriftungsinformation. – Prune

Verwandte Themen