2016-04-08 3 views
0

Wie ich GFlops berechnen kann für den Prozessor: Intel Xeon E5-2670 v2 Taktfrequenz: 2,5 GHz vCPU: 2 Speicher: 7,5 GiB Lagerung: 1 * 32 SSD Netzwerkleistung : Moderate (500 Mbps)Intel Xeon E5- 2670 v2 Calculating GFlops

Seine aws Instanz Typ: m3.large Ich bin nicht in der Lage, IPC zu finden und GFlops berechnen, so kann ich meine Kosten schätzen. Jede Hilfe wäre großartig.

Antwort

0

Xeon E5-xxxx v2 ist ein IvyBridge-Kern, daher unterstützt es FMA nicht. Details zur IvyBridge-Pipeline finden Sie unter Agner Fog's microarch pdf.

Wenn Sie Speicher-Engpässe vermeiden, kann IvB einen Durchsatz von zwei AVX-Vektor-FP-Operationen pro Takt aufrechterhalten. Der Ausführungsport 1 kann vmulps oder vaddps ausführen, aber Ausführungsport 0 kann nur vmulps ausführen.

So: 2.5G Takt-/sec * 2 FP Vektoren/Takt * 8 mit einfacher Genauigkeit Elemente/Vektor

Somit: single-precision 40GFlop/sec theoretischer max, unter Verwendung von AVX 256b Vektoren. Doppelpräzision: 20GFlop/sec (4 DP-Elemente pro 256b-Vektor).

anzumerken, dass sogar von L1-Cache, IVB nur 128b Lade-/Speicher-Datenwege hat und nur 2 Lasten aushalten kann und einen Speicher pro 2 Uhren, für 256b Vektoren.

mul hat 5c Latenzzeit, addieren hat 3c Latenzzeit, so brauchen Sie genug Parallelität auf Befehlsebene, um 5 oder 10 multipliziert im Flug auf einmal zu halten.

+0

Können Sie mir erklären oder geben Sie mir einen Link, wie Sie IPC berechnen? –

+0

@AnchalKhandelwal: Ich habe bereits im ersten Absatz getan. Für echten Code ist das nicht ganz trivial ([siehe einige meiner anderen SO-Antworten]) (http://stackoverflow.com/search?q=user%3Ame+latency+throughput+uops)), aber es ist einfach, den theoretischen max . Die Vektor-FP-Mul- und Add-Einheiten sind vollständig gepiped, was ich zu erwähnen vergessen habe. –

+0

Also um GFlops zu berechnen, könnten vCores direkt verwendet werden? Was ist, wenn meine vCores 32 ist. Dieser Prozessor hat 10 Kerne und 20 Threads. Sollte ich tun: (2,5 * 10 * 8) * 2 Prozessor? Details finden Sie unter: http://www.cpu-world.com/CPUs/Xeon/Intel-Xeon%20E5-2670%20v2.html –