2014-08-01から1ヶ月間の記事一覧

いや

10usec はおかしい気がする(4MB read write してるので理論値越えてる)。あとで調べるからちょっと待って。調べた。10usecでいい。まあプログラム間違ってたけど直しても10usecだった。

あと https://bwidawsk.net/ これ誰か読んで内容教えて。

またレイテンシ測るためだけに…の続編の続編

A10-7850KとかいうクソザコCPUを用意した。https://github.com/HSAFoundation/HSA-Runtime-AMD/tree/master/sampleこれの hsa_queue_store_write_index_relaxed() 〜 hsa_signal_wait_acquire() の間の時間が10usecぐらい。CPU間でも同期オブジェクト経由で…

x86-64 での nop と xchg eax, eax

いや上のを書いててふと思ったが、x86-64 の nop って xchg eax, eax ではなくね?http://www.pagetable.com/?p=6やっぱそうなのか… x86-32 本物の nop 命令は存在しない xchg eax, eax (0x90) は何もしない命令として、nop の別名が付いている x86-64 0x90 …

まあAVXのギャザー結局自作しないといけないのが全部悪いのだが… というか __m256d __attribute__((noinline, noclone)) avx_double_gather4(const double *p, unsigned int idx0, unsigned int idx1, unsigned int idx2, unsigned int idx3, __m256d vpred)…

&p[i-1] と &p[i]-1

同じではない。と、いうのをデバッガ使わないと気付けなかった。 こういう整数のラップに注意を払わない人間はC/C++を使うべきではない、ので明日から全部asmで書きます!!!!asmならこういう間違いしないからね!!!!!

あと書き忘れてたがそういえば実家は朝日新聞なのだが(ちなみに読んだのは8/5なので、例のアレは実物を見れた)、新聞見てたらよしたに先生の漫画が載っていて、 http://ameblo.jp/yoshitani/entry-11498893894.html 2013/4/1からやってるらしい。 ああいう作…

jom.exeを捨ててninja.exeを使おう

http://int.main.jp/files/ninja.exe 公式ソースのをwindows用にビルドしただけのやつ。ninja build はプロセス起動/statがクソ遅いWindowsでこそもっと使うべきなのになぜ俺はjomを使っていたのか。(ビルドが面倒だったから) 今は特に理由が無い限り cmake …

大阪

大阪へ行っていた。いつもテレビ見て関心するのだけど、今回は、TVCMで民安ボイスが流れてきてすっげー感動したのよさ。(Pepper君のCMです)はーTVCMで合成された声優ボイスが流れるとか5年前ぐらいのラノベの近未来設定でありそうだし、日本の近未来感すごい…