2016-12-20 3 views
5

Ich verwende TensorFlow für Windows mit einer Titan X GPU (12 GB Speicher). Wenn ich versuche, ein Netzwerk für Bilder von 256X256X1 mit Mini-Stapeln von mehr als 50 Bildern zu trainieren, stürzt mein Computer einfach ab und startet automatisch neu. Bei kleineren Mini-Chargen läuft es gut. Irgendwelche Hinweise auf was könnte das verursachen?Computer startet mit großen Mini-Batches in TensorFlow neu

+0

Die einzige Vermutung ist, dass etwas mit Ihrem RAM nicht stimmt. Überprüfen Sie es wie in [dieser Beitrag] beschrieben (http://superuser.com/a/425537/348793). – sygi

+1

Wie Ihr Netzwerk aussieht, ist wichtiger als Ihre Batch-Größe. Kannst du hier mehr Informationen posten? Wenn Sie am Ende riesige zusammenhängende Ebenen haben ... Ich denke, Sie haben nicht genug Speicher oder so. –

+0

Ich habe gesehen, dass Computer eingefroren sind, wenn TF versucht, zu viel CPU-Speicher zuzuweisen. So können Sie überprüfen, wie viel CPU-RAM Sie verwenden –

Antwort

0

Ich habe ähnliche Probleme in einigen Gaming-Foren gesehen, in denen der PC einfach heruntergefahren wurde, wenn die GPU stark ausgelastet war. Der Grund war normalerweise, dass die GPU mehr Strom benötigte, als das Netzteil verarbeiten konnte. Überprüfen z.B. here oder here. Es lohnt sich also zu untersuchen, ob Ihr Netzteil der Schuldige ist.

Edit: Kann das Programm SpeedFan kann Ihnen helfen, dies zu debuggen - es ist in der Lage, sowohl Spannungen und Messwerte von Temperatursensoren zu zeigen, die Sie auch sagen würden, wenn Ihr PC überhitzt ist (Ich habe das Werkzeug nie selbst verwendet, und ich bin auch nicht damit verbunden, habe es gerade online gefunden).

Verwandte Themen