-2
Ich brauche das schnellste BLAS-Paket für die Heavy-Matrix-Multiplikation. Ich benutze derzeit die Armadillo-Bibliothek inklusive Blas.Am besten geeignete BLAS-Gehäuse für Matrix-Operationen
Ich habe einige Nachforschungen gemacht und es zeigte auf OpenBLAS.
Nach einigen Tests zeigte es keine Verbesserung. Irgendwelche Gedanken?
Sie werden immer von der exponentiellen Anzahl von Operationen gefangen sein. Vektorisierung hilft. Manchmal kann Threading/OpenMP-Loop-Parallelität helfen. Die Kenntnis der Struktur der Matrix, z. B. dreieckig, kann helfen. Im Allgemeinen, nein, Sie sind von der Anzahl der benötigten Operationen gefangen. –
@ ScottM: Exponential? Es ist nicht einmal kubisch. Exponential ist schneller als jede polynomische Funktion. – MSalters
Können Sie uns sagen, welche Tests Sie durchgeführt haben? Ich benutze MKL BLAS zusammen mit Gürteltier und das zeigt enorme Verbesserungen, hauptsächlich aufgrund der (OpenMP) Parallelisierung. Sehen Sie sich auch [this thread] an (http://stackoverflow.com/questions/17639155/fast-lapack-blas-for-matrix-multiplication) – Darkdragon84