平方根

processingのプログラムで12秒かかる計算がcで7秒。
もっと工夫すればキャッシュ効果で速くなりそうだが、
一番時間がかかってそうな平方根の計算をどうにかするのがいいとおもい、
いろいろ調べてみるも、SSEが一番かなという結論に至る。
使用頻度は高いと思うので最速を知っておいたほうがいいだろう。
さらに高速にするにはGPUに手を伸ばさなければならないので、
とりあえずはSSEで限界を探る。