2016-05-31 5 views
0

Ich betreibe Tensorflow 0.8 auf Tesla K80 mit CUDA 7.5 und CUDNN v5. Alles ist in Ordnung, aber zwei Geräte können nicht aufeinander zugreifen.Unterstützt Tensorflow Tesla K80

Das Warnungsprotokoll ist unten aufgeführt. Vielen Dank.

I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 2 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 0 to device ordinal 3 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 2 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 1 to device ordinal 3 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 2 to device ordinal 1 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 0 
I tensorflow/core/common_runtime/gpu/gpu_init.cc:59] cannot enable peer access from device ordinal 3 to device ordinal 1 
+0

Ja, Sie sollten Tensorflow auf K80 verwenden können. Die angezeigten Warnungen ergeben sich aus der Konfiguration des Systems, an das die K80 angeschlossen sind, und nicht spezifisch für die K80 GPU oder Tensorflow. NVIDIA bietet Beispielcodes (z. B. simpleP2P, p2pBandwidthLatencyTest, deviceQuery), die alle verschiedene Arten von Informationen über P2P-Funktionen (Peer-Zugriff) Ihres Systems bereitstellen. –

+0

Vielen Dank für Ihre Hilfe. Ich versuche, simpleP2P Test zu laufen, und es zeigt, dass 2 GPU nicht p2p aufeinander zugreifen kann. Haben Sie eine Idee, warum es in meiner Maschine nicht aktiviert ist? Folgendes ist meine Umweltinfo. Vielen Dank. ubuntu 14.04, Tesla K80, Treiberversion: 352.39. – Brian

+0

Es hängt von Ihrem System ab, d. H. Dem Motherboard und dem System-BIOS. Werfen Sie einen Blick auf die Antwort von Hopobcn. Wenn Sie diese GPUs in einem 2-Sockel-Motherboard installiert haben, wie dort vorgeschlagen, können einige GPUs nicht direkt mit anderen Grafikprozessoren kommunizieren (P2P). Aber es ist unmöglich, eine genaue Antwort zu geben, ohne zu wissen, welches Motherboard Sie haben und an welche Buchsen die GPUs angeschlossen sind. –

Antwort

6

Ich wette, dass Sie einige Multi-Sockel-Konfiguration wie diese haben:

Two K80 from different PCIe root complex

wurden jeweils K80 ist nicht die gleiche PCIe Root-Complex zu teilen. Dann sind Peer-to-Peer-Zugriffe von GPU0 zu GPU1 erlaubt, aber nicht von GPU0 zu GPU2/GPU3.

Tensorflow sollte in der Lage sein, diese Art von System zu erkennen und manuelle Kopien zwischen GPUs durchzuführen.

3

Ja, TensorFlow sollte auf einem Tesla K80 GPU arbeiten (obwohl es nicht eine der officially tested devices ist). Wie Robert Crovella in his comment angibt, geben diese Warnmeldungen lediglich an, dass Ihr System nicht für den Peer-to-Peer-Zugriff zwischen den verschiedenen GPU-Geräten konfiguriert ist, aber Sie sollten weiterhin TensorFlow auf ihnen ausführen können.

Verwandte Themen