速度比較メモ

1920*1200 / 1M particle


31ms/1frame
intel xeon e5440 12288KB 2830MHz 1333MHz * 2


21ms/1frame
intel Core i5 750 2660MHz


速度がコア数に比例していない。この疑問を解決すべく調べたところ、
core i7はメモリバンド幅がかなり広がっているらしく、コア間の転送速度も速いらしい。
メモリアクセスの最適化は難しい。
もしかしたら、OSの違いかも。上がVista64、下がWin7 64。


以下コピペ
http://blog.goo.ne.jp/sdpaninf/e/0d8dd2558574f09f305bc1f1b8a4f672
一度メモリバンド幅の大きなシステム(CPU)を使って(慣れて)しまうと、メモリバンド幅の小さいシステムには戻りにくい。いろいろと工夫は考えているとはいるが、広範囲でメモリにランダムアクセスを行うような疎データを扱うプログラムだと露骨にこのバンド幅が効いてしまうので、バンド幅の小さいシステムとの差が開いてしまう。Intel は CPU の中に非常に広帯域なメモリを内蔵させるという計画を持っている。とは言ってもメモリバンド幅だけで性能が決まらないのも事実で、キャッシュや TLB も絡んできて、特に疎問題の場合はデータを取って解析してみないとわからない。とりあえず以下のような結果がある。


1: Intel Core i7 965(3.2GHz) : メモリバンド幅 約 23 Gbytes/s
ec.
theta6.dat-s (4スレッド)
sdpa 7.2.1 : 1.502秒 / 1反復
sdpa 7.x 開発版 : 0.880秒 / 1反復
高速化比率 1.502 / 0.880 = 1.71 倍


2: Intel Xeon 5345 (2.33GHz) : メモリバンド幅 約 6 Gbytes/sec.
theta6.dat-s (4スレッド)
sdpa 7.2.1 : 2.172秒 / 1反復
sdpa 7.x 開発版 : 2.150秒 / 1反復
高速化比率 2.172 / 2.150 = 1.01 倍


インテルからコピペ
インテル® Xeon® プロセッサー 5500 番台で採用された "インテル® QuickPath テクノロジー" は、プロセッサーチップセットといったプラットフォームのコアとなるデバイス間をリンクあたり最大 25.6 GB/秒の帯域で結びます。また、最大 8 MB の L3 キャッシュ、統合型メモリー・コントローラー、最大 18 スロット (DP 構成時) の DDR3 メモリーをサポートし、メモリー帯域幅は最大 32 GB /秒。これはインテル® Xeon® プロセッサー 5400 番台の最大 3.5 倍に達します。これにより大規模で高帯域の共有メモリーシステムが実現できるため、特にメモリー帯域幅を重視するアプリケーションなどで効果を発揮します。


25.6GB/s
Core i7 950
Core i7 920


21.3GB/s
Core i7 870
Core i7 860
Core i5 750


こんなのみつけた
http://www.sonycsl.co.jp/~owd/pdfs/0811-WISS08.pdf