2014-01-01から1ヶ月間の記事一覧
どうやったら組み込み業界の人々がweb業界の人々みたいに、業務内容をブログに書けるか、みないなことを考えていたのだが、web業界の人々はオープンソース(て何?)なフレームワークを使ってるし、トップレベルエンジニアは自社開発してるとこにいるから、まあ…
プログラマが集中してる時は邪魔すんな、みたいなのって、当然のように語られてるけど、あれ、正しくないこともよくあると思う。 まあ、真面目な話をすると、プログラマの障害の半分くらいはコミュニケーションロスから出てくるのだから、作業効率半分くらい…
全プロセッサメーカーはインストゥルメンテーションツールを用意すべき。世界のIntelが公開してる pin をご覧ください http://software.intel.com/en-us/articles/pin-a-dynamic-binary-instrumentation-tool。Intelがつくったvalgrindみたいなツール、Intel…
cuda-memcheck とかいう CUDA で valgrind みたいなことができるツールがある。 ↓こんなードを書いたとする。 #include <stdio.h> __global__ void f(int *ptr) { int tid = threadIdx.x; ptr[tid] = tid; } int main() { int *dmem; int hmem[32]; memset(hmem, 0, s</stdio.h>…
まあ最近のインターネットを活用した鬱研究によると、自分のこと悪く言うのが一番良くないと言われつつあった。 しかし、この点エンジにゃーは若干不利だよな。エンジにゃーは、それなりに、ものごとを悪く考えるのが仕事として有利な場面があって、日頃から…
はかっていただきました。ありがとうございます。 https://twitter.com/neutral_tao/status/426943905012006912 https://twitter.com/neutral_tao/status/426945868516687873enqueue kernel latency 80usec…手元のマシンだとNVIDIAのは40usec、Intel HD Grap…
madはなんか動かすと止まるので別にはからないといけなくて別にはかったら mad1 throughput 77GFlops だったhttp://sdrv.ms/M0O9Q2 https://github.com/tanakamura/clminibench前と比べて madとfma間違ってたの修正 radeon用に調整 たくさんenqueueした場合…
SilvermontはCPUコアだけをさすから、こういうGPUを含む文脈ではBay Trailと書くべきでは?だからダメなんだよお前は。
そう言えば書いてなかった。http://int.main.jp/txt/ai-isa-jit.html コード : https://github.com/tanakamura/ai-isa-jit/tree/gpgpu3 (多分僕以外が使えるものではない)GCNだと、理論値出すには最低CUあたり512 item立ち上げないといけない理由はあとで読…
thread-safe にしろと明記してあるが、 Async-signal-safe にしろと明記されてないから、全然問題無いということなのかもしれない。まあ、明記されてないから大丈夫というのも気持ち悪いが、Async-signal-safeを実現するのは、相当難易度高いので、明記され…
http://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/clSetEventCallback.html これのコールバック(pfn_event_notify)正しく実装するの不可能では?という気がした 経緯 : https://twitter.com/tanakmura/status/399251693092605952 https://twitter…