Wie kann ich FLOPS meiner Anwendung berechnen? Wenn ich die Gesamtzahl der ausgeführten Anweisungen habe, kann ich sie durch die Ausführungszeit teilen. Aber, wie die Anzahl der ausgeführten Anweisungen zu zählen?Berechnen von FLOPS (Gleitkommaoperationen pro Sekunde)
Meine Frage ist allgemein und Antwort für jede Sprache wird sehr geschätzt. Aber ich suche nach einer Lösung für meine Anwendung, die von C/C++ und CUDA entwickelt wurde.
Ich weiß nicht, ob die Tags korrekt sind, bitte korrigieren Sie mich, wenn ich falsch liege.
möglich Duplikat von [Wie Gflops eines Kernels zu berechnen] (http://stackoverflow.com/questions/7875607/how-to-calculate-gflops-of-a-kernel) – talonmies
Ich bin mir dieser Frage bewusst! Meine Frage ist allgemein. Wie berechnet man FLOPS? Sogar Multi-Core. Die Antwort könnte auch meinem Fall "CUDA" helfen. – ahmad
Ich habe geschrieben, wie NVIDIA-Tools verwendet werden können, um FLOPs in [Berechnung der erreichten Bandbreite und FLOPS ...] (http://stackoverflow.com/questions/12539300/calculating-achied-bandwidth-and-flops-gflops-and) zu sammeln -evaluate-cuda-kernel-perfor). Für x86 gibt es mehrere Linux-Bibliotheken zur Berechnung von FLOPs. Der x86-Leistungsmonitor unterstützt das Zählen von FLOPs, aber Sie müssten das Handbuch lesen, um die Besonderheiten zu verstehen (spekulative Anweisungen, was gezählt wird, ...) –