2014-01-01から1ヶ月間の記事一覧

どうやったら組み込み業界の人々がweb業界の人々みたいに、業務内容をブログに書けるか、みないなことを考えていたのだが、web業界の人々はオープンソース(て何?)なフレームワークを使ってるし、トップレベルエンジニアは自社開発してるとこにいるから、まあ…

プログラマが集中してる時に話しかけてあげよう

プログラマが集中してる時は邪魔すんな、みたいなのって、当然のように語られてるけど、あれ、正しくないこともよくあると思う。 まあ、真面目な話をすると、プログラマの障害の半分くらいはコミュニケーションロスから出てくるのだから、作業効率半分くらい…

インストゥルメンテーション

全プロセッサメーカーはインストゥルメンテーションツールを用意すべき。世界のIntelが公開してる pin をご覧ください http://software.intel.com/en-us/articles/pin-a-dynamic-binary-instrumentation-tool。Intelがつくったvalgrindみたいなツール、Intel…

cuda-memcheck

cuda-memcheck とかいう CUDA で valgrind みたいなことができるツールがある。 ↓こんなードを書いたとする。 #include <stdio.h> __global__ void f(int *ptr) { int tid = threadIdx.x; ptr[tid] = tid; } int main() { int *dmem; int hmem[32]; memset(hmem, 0, s</stdio.h>…

自分に対してダメとか言ったらいけない

まあ最近のインターネットを活用した鬱研究によると、自分のこと悪く言うのが一番良くないと言われつつあった。 しかし、この点エンジにゃーは若干不利だよな。エンジにゃーは、それなりに、ものごとを悪く考えるのが仕事として有利な場面があって、日頃から…

Kaveri

はかっていただきました。ありがとうございます。 https://twitter.com/neutral_tao/status/426943905012006912 https://twitter.com/neutral_tao/status/426945868516687873enqueue kernel latency 80usec…手元のマシンだとNVIDIAのは40usec、Intel HD Grap…

Silvermont

madはなんか動かすと止まるので別にはからないといけなくて別にはかったら mad1 throughput 77GFlops だったhttp://sdrv.ms/M0O9Q2 https://github.com/tanakamura/clminibench前と比べて madとfma間違ってたの修正 radeon用に調整 たくさんenqueueした場合…

追記

SilvermontはCPUコアだけをさすから、こういうGPUを含む文脈ではBay Trailと書くべきでは?だからダメなんだよお前は。

関東GPGPU勉強会#3

そう言えば書いてなかった。http://int.main.jp/txt/ai-isa-jit.html コード : https://github.com/tanakamura/ai-isa-jit/tree/gpgpu3 (多分僕以外が使えるものではない)GCNだと、理論値出すには最低CUあたり512 item立ち上げないといけない理由はあとで読…

いや

thread-safe にしろと明記してあるが、 Async-signal-safe にしろと明記されてないから、全然問題無いということなのかもしれない。まあ、明記されてないから大丈夫というのも気持ち悪いが、Async-signal-safeを実現するのは、相当難易度高いので、明記され…

clSetEventCallback()を正しく使いたい(書きかけ)

http://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/clSetEventCallback.html これのコールバック(pfn_event_notify)正しく実装するの不可能では?という気がした 経緯 : https://twitter.com/tanakmura/status/399251693092605952 https://twitter…