2008-01-01から1年間の記事一覧
このメモリ階層変化しないのかな。来年には変わってるとかありそうだけど。 CUDA上からは見えないがパフォーマンスに影響が CUDAが変わる そしてプログラマはそれを受け入れられるか?まあ、CUDA受け入れる人だったらこのぐらい泣きながら諦めて対応する気が…
思ったより呼び出しコスト少ないな… #include <stdio.h> #include <cutil.h> #include <sys/time.h> #define NUM_BLOCKS 1 #define NUM_THREADS 1 __global__ static void nanika(int *x, int y, int i) { x[0] = 240+i; } unsigned long getu() { struct timeval tv; gettimeofday(&tv, NU</sys/time.h></cutil.h></stdio.h>…
これproject以下のサンプル充実しすぎだろ…FFTとソートとマンデルブロ集合とmatmul,DCT,MTとかやられたら、趣味プログラマのネタは無い。
ビルド方法がわからん。とりあえず素直にcommon.mk使っておくか。 # common.mk NVCCFLAGS += --compiler-options -fno-strict-aliasing CXXFLAGS += -fno-strict-aliasing CFLAGS += -fno-strict-aliasing並列化の時代においては全プログラマが意識すべきエ…
会社で何人に心配していただきましたが、今のところ改善の方向に向かっているので、多分大丈夫です。
貧血というと、去年採血時に貧血起こしたリベンジだぜ、と思ってたのだけど、今年も貧血起こしたので、来年こそはなんとかしたいと思いました。
まず、重要な点として、「拭いたら赤かった」とかのレベルではなく、ほんとに出血してた、という点は説明しとかないといけないだろう。基本的に布団の上に座ってるのだけど、なんか立ち上がったら布団が鼻血出したみたいになってた。 - まず、先週火曜あたり…
ゴキブリ出なくなったのでそろそろ戻そうかと思ったら、尻から血が出るようになったので、しばらくこのままにしておく。
結局Atom(ズアルコアのやつ)にした。ケースとMBあわせて2.2万くらい。HDDとメモリは余ってるのを使った。物欲発散のコストパフォーマンスは素晴らしいとしか言いようがない。体感としてはCore2とあまり変わらないと感じてしまう僕はどうかしてる。CPUという…
http://developer.mozilla.org/en/Pork(http://steps.dodgson.org/?date=20081012 より)すごいな。C++でリファクタリングツールとか、 C++な時点で無理 プリプロセッサがあるので無理 という二重苦なので普通あきらめるもんだが。clang(http://clang.llvm.or…
フライパンがなにをやってもありとあらゆるものが瞬時に焦げ付くみたいな感じになっていたので、新調した。すげー。焦げ付かないよ。感動した。最近僕の一人暮らし生活を支えてくれた同胞たちが次々と死んでいく気がする。 フライパン 自転車(チェーン切れそ…
もう一匹採れた。一日で二匹。このペースでいくと来年には730引きのごきたん達とともに生活をすることになる計算になる。
家を片付けるべき。
結局、「人参食べてるごきたん発見」「鍋しゅうへんにごきたん発見」というイベントが発生し、さすがにこのエンカウント率は過去に例をみないので、そろそろ対策が必要だろうと思い、(僕の中で)元祖ごきたん退治のゴキブリホイホイを設置した。設置した瞬間…
また会社の人にバレた。先日IA-64を買えと勧めてきた人である。まあいいのだけど。最近反社会的なことは書いてない(はず)だし。というかむしろ書くことがないというか、書くことはあるけど、またゴキブリがいた話とかでゴキブリブログ。
やっぱIA64のマシン欲しいな。揺れる。Atomとどっちがいいかな…Atom - EM64T付いてれば結構好き。レジスタ16個でin-order 2-issueというバランスは大変好み。安い。3,4万あれば諸々あわせて十分揃う。今流行りものIA64 - 一度は触れたい。多分この機会を逃す…
MIPSの乗算がスケジューリングで速くなるとか適当なこと書いてる気が。調べてから書きましょう。
洗ってなかった鍋を空けるとゴキブリが浮いていた。そろそろゴキブリたんの出現する季節も終わるころなので[要出店]そろそろ出現数も減ってくれないと、我が家はゴキブリたんにとって過ごしやすい環境になっているという説を強く否定する材料が減っていると…
全然説明を書いてなかった。 p resetcount hoge() p dumpcount とかすると計測できます。32bitカウンタですぐ溢れるので、計測時間はほどほどにお願いします。あと、命令の追加方法については、bitblt命令(bitbltが超速くなる命令)を参考にしています。(別に…
というわけで、IA64のマシンよりもAtomのマシンを買うべきかなぁ…という気がする。安いし。ところで、AtomってPentium4とトランジスタ数がほぼ一緒ってどうかしてると思うのだが。ただのin-order 2issueのしょっぱいアーキテクチャ、と、Out-of-Orderの謎デ…
せっかく徹夜して測ったので貼っとくかhttp://morihyphen.hp.infoseek.co.jp/files/perf.diff命令ごとのカウントを測るようにするパッチです。今日のHEADとの差分です。正確性は知らない。あと手元のCore2で測ったらBigNumの乗算が遅いということは無くて、s…
時々IA64のマシンが欲しいなどと言っていたのだが、同僚が個人で買える価格のを見つけたらしく、僕に買えと勧めてきたので買いそうでまずい。(置き場所に困る)IA64はコンパイラ屋の夢が詰まってると思うのだけど、コンパイラ屋にも流行らなかったな。あと、…
話は変わるが、漢字変換といえば、世の中には、MS-IMEは学習機能を切って使ってる人がいるらしい。変換キーを何回押せばいいかが固定されるので速いらしい。なるほどなー。
起きた。スケジュールに無理があったことは否定できない。ちなみに上の例の回答は、「BigNumの乗算が遅い」でした。
少し…寝る…
やばい睡眠の限界が…
僕があまりにもRuby知らないことに気付いた。コーナーケースを突くっぽい例が全然思い付かないな。
def fact(n) if(n > 1) n * fact(n-1) else 1 end end 8.times{ fact(5000) } これは何が遅いでしょう?とかのネタならいけそうかな…想定読者が無いことに気付いた。まあいいや。想定読者自分で。
とりあえず必要な計測だけやって資料は現場で書くか…あとで計測必要になったときに死ぬけど…
bitbltなんか環境だけつくって寝ようかと思ったら朝だった