2016-03-21 8 views
-2

Ich brauche das schnellste BLAS-Paket für die Heavy-Matrix-Multiplikation. Ich benutze derzeit die Armadillo-Bibliothek inklusive Blas.Am besten geeignete BLAS-Gehäuse für Matrix-Operationen

Ich habe einige Nachforschungen gemacht und es zeigte auf OpenBLAS.

Nach einigen Tests zeigte es keine Verbesserung. Irgendwelche Gedanken?

+0

Sie werden immer von der exponentiellen Anzahl von Operationen gefangen sein. Vektorisierung hilft. Manchmal kann Threading/OpenMP-Loop-Parallelität helfen. Die Kenntnis der Struktur der Matrix, z. B. dreieckig, kann helfen. Im Allgemeinen, nein, Sie sind von der Anzahl der benötigten Operationen gefangen. –

+0

@ ScottM: Exponential? Es ist nicht einmal kubisch. Exponential ist schneller als jede polynomische Funktion. – MSalters

+0

Können Sie uns sagen, welche Tests Sie durchgeführt haben? Ich benutze MKL BLAS zusammen mit Gürteltier und das zeigt enorme Verbesserungen, hauptsächlich aufgrund der (OpenMP) Parallelisierung. Sehen Sie sich auch [this thread] an (http://stackoverflow.com/questions/17639155/fast-lapack-blas-for-matrix-multiplication) – Darkdragon84

Antwort

0

Stellen Sie sicher, dass Sie das 64-Bit-Paket verwenden und es in das Gürteltier aufgenommen haben.

Verwandte Themen