K10 vs CoreMA修正

http://hibari.2ch.net/test/read.cgi/jisaku/1313382969/248
とか書いてあったので、lddqu試してみるか、と、思ったら現象再現しなくて死んだ。


もうちょっと頑張って調べたところ、キャッシュライン境界跨いだときの問題のように見えるので修正した
http://int.main.jp/txt/k10/index.html#sec7

K10は、16byte揃ってる時にスループット0.5で、揃っていないときに1.0。
Sandyは、キャッシュライン跨がなければ16byte境界に関係なく0.5だが、キャッシュラインまたぐと4.5に落ちるっぽい。

あと、lddquにしても効果なかった。