追記06/11 : waifu2x OpenCL 版

http://int.main.jp/files/waifu2x-converter_x64_20150611_2.exe

多分良い感じになったはず。Linuxでしか動作確認していないので動かない可能性は残っている。(Kaveri 用のWindows入れたHDDどれかわからなくなってるので…)

親切な人いたら、動いたかどうか(とわかるなら、GPU名+最後に出てくるFLOPS値)をコメントで教えてもらえると助かります。


NVIDIAGPUで動かすとなんか止まるので、今はAMD GPU でしか有効にしていない。


効率は、理論値 737[GFLOPS] の A10-7850K で、260[GFLOPS](35%) ぐらい出ている。OpenCL部分だけならピークで360[GFLOPS](48%) ぐらい。caffe 版は効率30%〜40%ぐらいに見えるので、同じくらいの GPU なら Radeon でも caffe 版ぐらいの性能になってると予想される。


あと、http://d.hatena.ne.jp/w_o/20150609#1433854645 が気になったので、結局スレッドプール入れた。カスペル付いてる環境を使ってる人もマシになったはず。



色々考えたけど、結局、気合いブロッキングと気合いチューニングだけでなんとかした。

https://github.com/tanakamura/waifu2x-converter-cpp/blob/3843eac74730ac608bcc71a163be1df4307c260e/src/modelHandler_OpenCL.cl#L242

このへんあたりがお気に入りかな…