関東GPGPU勉強会 #2
というわけで、せっかくだから記録を書いておくと…覚えてるわけが無いのだった。(http://togetter.com/li/511911 多分こっちを見たほうが情報量がある)
このときは、Mali-T604 は19.0GFLOPSと書いてるのだけど、どこで見たか忘れたけど、72か74ぐらいが理論値らしい。ただ、この単純にmad4を並べた書きかたで出ないなら、どうやったら出るんだという気がする。
気になる記述としては、
に、「sinとかcosに含まれる演算を計算性能に含めるのはセコいだろ(まあでもdot productのは含めてもいいかな…)(超意訳)」とか書いてあって、なんかdot() なら性能出るのかも、という気がした。たぶん、パイプライン上に複数の演算があって、特定の書きかたしたら、複数の演算が1cycleでできるようになってるとかなのではないかな…
しかしNexus10 のOpenCLはつぶされたのでもう確認できない。