http://int.main.jp/files/waifu2x-converter_x64_20150611_2.exe
多分良い感じになったはず。Linuxでしか動作確認していないので動かない可能性は残っている。(Kaveri 用のWindows入れたHDDどれかわからなくなってるので…)
親切な人いたら、動いたかどうか(とわかるなら、GPU名+最後に出てくるFLOPS値)をコメントで教えてもらえると助かります。
NVIDIAのGPUで動かすとなんか止まるので、今はAMD GPU でしか有効にしていない。
効率は、理論値 737[GFLOPS] の A10-7850K で、260[GFLOPS](35%) ぐらい出ている。OpenCL部分だけならピークで360[GFLOPS](48%) ぐらい。caffe 版は効率30%〜40%ぐらいに見えるので、同じくらいの GPU なら Radeon でも caffe 版ぐらいの性能になってると予想される。
あと、http://d.hatena.ne.jp/w_o/20150609#1433854645 が気になったので、結局スレッドプール入れた。カスペル付いてる環境を使ってる人もマシになったはず。
色々考えたけど、結局、気合いブロッキングと気合いチューニングだけでなんとかした。
このへんあたりがお気に入りかな…