とりあえず - w

https://gist.github.com/tanakamura/7297025
この時点(fputs相当)で 2.5[nsec/byte] (1nsec = 1e-9sec)。

既にWriteFileのスループット出てないな。キャッシュ載ってるだろうからこんなもんか。

ループ全体(640x480)だと

まあ

ぐらいか

なんらかのマジックでstrlenが消せるとすると、memcpyにも最適化が入って(VCだとmovqの連続になる)、 1.3[nsec/b]。

まあバッファリング一回の理論値がこのへんか。もとのprintfが16.5[nsec/b]ぐらいなので、このぐらい出せるとprintfの10倍となる。