2017-01-12 6 views
1

Ich habe eine N-Serie Azure VM (die Data Science VM) mit Tesla K80 GPU. Laut dem NVIDIA-Scanner ist mein GPU-Treiber auf dem neuesten Stand. Wenn ich mein CNTK Brainscript starte, heißt es "No GPUs Found" und läuft im CPU-Modus. Was kann ich tun, um Fehler zu beheben?CNTK auf Azure Data Science VM

requestnodes [MPIWrapper]: using 1 out of 1 MPI nodes on a single host (1 reques 
ted); we (0) are in (participating) 
------------------------------------------------------------------- 
Build info: 

      Built time: Dec 22 2016 01:43:24 
      Last modified date: Thu Dec 22 01:35:04 2016 
      Build type: Release 
      Build target: GPU 
      With 1bit-SGD: yes 
      With ASGD: yes 
      Math lib: mkl 
      CUDA_PATH: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8 
.0 
      CUB_PATH: c:\src\cub-1.4.1 
      CUDNN_PATH: C:\local\cudnn-8.0-windows10-x64-v5.1 
      Build Branch: HEAD 
      Build SHA1: 8e8b5ff92eff4647be5d41a5a515956907567126 
      Built by svcphil on DPHAIM-24 
      Build Path: C:\jenkins\workspace\CNTK-Build-Windows\Source\CNTK\ 

------------------------------------------------------------------- 
No GPUs found 

Edit: hier ist die Ausgabe von NVidia_smi.exe:

C:\Program Files\NVIDIA Corporation\NVSMI>.\nvidia-smi.exe 
Fri Jan 13 19:00:43 2017 
+-----------------------------------------------------------------------------+ 
| NVIDIA-SMI 369.30     Driver Version: 369.30     | 
|-------------------------------+----------------------+----------------------+ 
| GPU Name   TCC/WDDM | Bus-Id  Disp.A | Volatile Uncorr. ECC | 
| Fan Temp Perf Pwr:Usage/Cap|   Memory-Usage | GPU-Util Compute M. | 
|===============================+======================+======================| 
| 0 Tesla K80   TCC | 0BD1:00:00.0  Off |     Off | 
| N/A 43C P8 27W/149W |  0MiB/12189MiB |  0%  Default | 
+-------------------------------+----------------------+----------------------+ 
| 1 Tesla K80   TCC | 5871:00:00.0  Off |     Off | 
| N/A 35C P8 34W/149W |  0MiB/12189MiB |  0%  Default | 
+-------------------------------+----------------------+----------------------+ 

+-----------------------------------------------------------------------------+ 
| Processes:              GPU Memory | 
| GPU  PID Type Process name        Usage  | 
|=============================================================================| 
| No running processes found             | 
+-----------------------------------------------------------------------------+ 
+0

Noch ein Hinweis: Die VM ist Windows Server 2012 R2. Es handelt sich um eine Standard-NC12-Azure-Instanz. –

+0

Ich habe versucht, den Treiber von NVIDIA zu installieren, aber die Treiberinstallation schlägt fehl. 377.35-tesla-desktop-winserver2008-2012r2-64bit-international-whql –

Antwort

2

Die Windows Data Science VM gehört standardmäßig nicht zu den GPU-Treibern, CUDA usw. Wir haben eine Erweiterung namens "Deep Learning Toolkit für DSVM", die Treiber, CUDA und GPU Edition von Deep Learning Software hinzufügt wie CNTK, Tensorflow, MxNet.

Mehr Info: http://aka.ms/dsvm/deeplearning

Wir veröffentlichten kürzlich auch eine Ubuntu version of DSVM mit eingebauten CUDA GPU-Treiber und einige mehr tief Learning-Tools und kann entweder auf GPU VM oder CPU nur VMs auf Azure bereitgestellt werden.

+0

Update: Windows 2016 Data Science VM (http://aka.ms/dsvm/win2016) kommt mit GPU-Treibern, CUDA und mehreren Frameworks wie Tensorflow, Mxnet, Microsoft Cognitive Toolkit, Chainer. Wir fügen ständig neue Tools hinzu. Bitte überprüfen Sie die Produktseite für die neuesten. –

1

Wäre es möglich, dass Sie den Python-Notebooks laufen und sehen, wenn man sich mit dem Gerät laufen konnte werden auf gpu gesetzt (Ich würde)? oder von aktivierter CNTK Python-Umgebung könnten Sie versuchen, ein Gerät zu setzen.

Dies könnte Ihnen einige Hinweise geben, ob es sich um ein Brainscript-spezifisches Problem handelt.

+0

Danke für die Weiterverfolgung. Hier ist die Ausgabe dieses Skripts: Traceback (letzter Aufruf zuletzt): Datei ". \ TestGPU.py", Zeile 3, in C.device.set_default_device (C.device.gpu (0)) Datei "E : \ local \ Anaconda3-4.1.1-Windows-x86_64 \ envs \ cntk-py34 \ lib \ site-packages \ cntk \ device.py ", Zeile 76, in gpu zurückgeben cntk_py.DeviceDescriptor.gpu_device (device_id) ValueError: Die angegebene GPU-Geräte-ID (0) ist ungültig. –

+0

Die NVIDIA-Diagnosewerkzeuge werden jetzt ausgeführt und ich kehre zurück. –

+0

Das hat mich auf den richtigen Weg gebracht. Es wäre gut, wenn install.ps bei der Installation von GPU-fähigen CNTK vor fehlenden CUDA-Abhängigkeiten warnt. –

0

Nun, das Python-Skript und Brainscript funktionieren jetzt, nach der Installation von CUDA (Ich habe es installiert, um NVIDIA_SMI auszuführen). Ich hätte nicht annehmen sollen, dass das Azure Data Science-Image (das nur mit einer N-Series-VM funktioniert) die erforderlichen NVIDIA-Bibliotheken vorinstalliert hat. :-)

+1

Das ist gut zu wissen. Danke für die Berichterstattung. Übermittelt die relevanten Teams, die die VMs der N-Serie unterstützen, für zukünftige Upgrades. –