http://d.hatena.ne.jp/w_o/20141225#1419437605

一貫性の空間がグローバルに一個しかないから、まだ今のCPUに依存してしまってる気がするんだよな。

良い例があった。

OpenCL C 2.0 では、SVMというのがあって、デバイスを超えてメモリ共有できるが、ここで、どのデバイスまでメモリアクセスを見せるか、というのを指定できるように拡張してある。

https://www.khronos.org/registry/cl/sdk/2.0/docs/man/xhtml/atomic_store.html

こういうのが足りない。