Knigts Landing とクロックダウンする石 part 1 (cdr 9)

そもそもinstruction-bench まともにしたのは、KNLで計測したかったからなのだけど、KNL はマニュアルどおりの性能が出ていないという現象が観測できる。


https://github.com/tanakamura/instruction-bench/blob/master/knl.log#L120

KNL は VPU を2個持っていて、サイクル当たり2個のFMAを実行できるということになっているが、 vfmaps のIPCは、1.67-1.68程度しか出ていない。

最初は分岐とかがデコーダを圧迫してるのかと思ったのだけど、add とかのスカラはIPC 2.0近くいってるんだよね。これの問題は、デコーダではなくて、FPUのほうに問題あることがわかる

(もう今日が終わりそうなので明日に続く)