Ich habe vor kurzem das Cuda Toolkit 5.5 mit Treiber 331.67 installiert (ich habe eine GeForce GTX 680). Aus irgendeinem Grund kann ich keine der Test scrips laufen:kein CUDA-fähiges Gerät erkannt (mit Ubuntu 12.04.4 Server)
$./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery
./NVIDIA_CUDA-5.5_Samples/1_Utilities/deviceQuery/deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL
folgte ich die Schritte auf der „Erste Schritte“ hier
http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/
und machte ein Skript, um die Zeichengerät zu erstellen bei Startdateien (wie ich die Server-Edition von Ubuntu solche Grafikdateien leite werden nicht standardmäßig erstellt):
$ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195, 0 Apr 11 17:29 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Apr 11 17:29 /dev/nvidiactl
der Ausgang für executin g der Befehl nvidia-smi -a
ist (sowohl für normale Benutzer und Root-Benutzer):
Failed to initialize NVML: Unknown Error
Hier
$ lsmod | grep nvidia
nvidia 11335080 0
$ modinfo nvidia
filename: /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias: char-major-195-*
version: 331.67
supported: external
license: NVIDIA
...
...
Irgendwelche Vorschläge einige Informationen über das nvidia Modul ist? Vielen Dank.
EDIT # 1 Ich habe versucht, die Herabstufung des Fahrers 319,76:
$ modinfo nvidia
filename: /lib/modules/3.11.0-17-generic/updates/dkms/nvidia.ko
alias: char-major-195-*
version: 319.76
supported: external
...
Nun, wenn ich nvidia-smi -a
betreibe ich folgendes erhalten:
NVIDIA: API mismatch: the NVIDIA kernel module has version 304.116,
but this NVIDIA driver component has version 319.76. Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error
Ich installierte die nvidia-current-updates
und nvidia-settings-updates
Pakete von der Repos vor der Installation der Treiberdatei und ich vermute, dass dort der Konflikt entstand. Ich habe keine Lösung gefunden, aber das ist einen Schritt näher, denke ich. Hier ist das Ergebnis von modprobe -l | grep nvidia
kernel/drivers/video/nvidia/nvidiafb.ko
kernel/drivers/net/ethernet/nvidia/forcedeth.ko
updates/dkms/nvidia.ko
updates/dkms/nvidia_304_updates.k
Was ist das Ergebnis der Ausführung von 'nvidia-smi -a' als normaler Benutzer und dann als root-Benutzer? Bitte fügen Sie die Ergebnisse in Ihre Frage ein, nicht in die Kommentare. –
Was ist die Ausgabe von 'nvidia-smi -a'? – cklin
Wenn "nvidia-smi -a" einen NVML-Fehler zeigt, wenn er als root-Benutzer ausgeführt wird, ist der Treiber nicht richtig geladen oder kann die GPU nicht finden. Möglicherweise müssen Sie das System neu starten oder den Treiber neu laden. Sie sollten auch überprüfen, dass die Ausgabe von 'lspci | grep -i nvidia' eine GPU (Ihre GTX 680) als vorhanden anzeigt. –