関東GPGPU勉強会 #2

というわけで、せっかくだから記録を書いておくと…覚えてるわけが無いのだった。(http://togetter.com/li/511911 多分こっちを見たほうが情報量がある)


このときは、Mali-T604 は19.0GFLOPSと書いてるのだけど、どこで見たか忘れたけど、72か74ぐらいが理論値らしい。ただ、この単純にmad4を並べた書きかたで出ないなら、どうやったら出るんだという気がする。



気になる記述としては、

http://community.arm.com/groups/arm-mali-graphics/blog/2013/05/13/flipping-the-flops--how-arm-measures-gpu-compute-performance

に、「sinとかcosに含まれる演算を計算性能に含めるのはセコいだろ(まあでもdot productのは含めてもいいかな…)(超意訳)」とか書いてあって、なんかdot() なら性能出るのかも、という気がした。たぶん、パイプライン上に複数の演算があって、特定の書きかたしたら、複数の演算が1cycleでできるようになってるとかなのではないかな…


しかしNexus10 のOpenCLはつぶされたのでもう確認できない。