Was ist meine beste Wette für die Berechnung der Skalarprodukt eines Vektors x mit einer großen Anzahl von Vektoren y_i, wobei x und y_i eine Länge von 10k oder so haben.Punkt Produkt - SSE2 vs BLAS
- Schieben Sie die y in einer Matrix und verwenden Sie eine optimierte
s/dgemv
Routine? - Oder vielleicht Handcoding eine SSE2-Lösung (ich habe keine SSE3, nach cpuinfo).
Ich bin nur auf der Suche nach allgemeinen Leitlinien hier, so dass alle Vorschläge nützlich sein werden.
Und ja, ich brauche die Leistung. Danke für jedes Licht.
Welche Compiler verwenden Sie? –