プロフィール

kosaki

Author:kosaki
連絡先はコチラ

ブログ検索
最近の記事
最近のコメント
最近のトラックバック
リンク
カテゴリー
月別アーカイブ
RSSフィード
FC2ブログランキング

スポンサーサイト このエントリーをはてなブックマークに追加

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。


スポンサー広告 | 【--------(--) --:--:--】 | Trackback(-) | Comments(-)

prefetch このエントリーをはてなブックマークに追加

http://d.hatena.ne.jp/issei_y/comment?date=20100501§ion=1272668964#c

によると、なんか最近のチェスソフトは手動プリフェッチで高速化とかしてるらしい。へー

面白いのはprefetch乱用ソフトの最右翼だったLinuxはprefetchを削除する方向に話を進めていることである。
最近はIntelがプリフェッチを推奨してないのよ。CPU内蔵の自動プリフェッチのほうが石の内部事情に
詳しいので。
なのでインテルコンパイラがプリフェッチ命令を削除してしまうケースがあるというのはおそらく意図的な
ものじゃないかな。

昔のCPUは自動プリフェッチとか弱かったから意味あったんだろうけど・・・
関連記事


プログラミング | 【2010-05-15(Sat) 16:29:28】 | Trackback:(0) | Comments:(2)
コメント
Intel CPU の hardware prefetch はストライド付きメモリアクセスをストリームと認識できるだけのはずなので、RDBMS やガベコレのようにメモリアクセスがほとんど予測不能なものや、「フィボナッチ数列でインデックスアクセス」のようなロジックはあるものの CPU に判定不能なものは、software pfetch が利き続けると思います。

ただ昨今は hardware pfetch がストリームとして認識できる本数がどんどん増えています(Core 系はメモリ→キャッシュで12ストリーム)ので、メモリアクセスパターンが異なる複数のスレッドで hardware pfetch が混乱するから software prefetch を書くというのはなくなっていくのかも知れません。

それに Intel x86-64 CPU の Out-Of-Order 実行機能はデタラメに強化され続けています。Core i7 は re-order buffer が 128 μOPで、48 load buffer を持っているので、分岐予測が当たる限り μOP換算で 128 命令の範囲に(依存のない)ロードアクセスは投機的にメモリリードしてしまいます。Software prefetch を書くならこの効果分よりも離して書かないと意味がないので、どんどん software prefetch を書くのは難しくなって行きますな。
2010-05-15 土 12:00:41 | URL | nminoru #5T0adQno [ 編集]

問題は、CPUのモデル非依存で効果のあるprefetchって書きようがないって事なんだと思います。
CPU世代変わるたびにOSの書き直しとかやってられんし。
2010-05-15 土 12:38:25 | URL | kosaki #- [ 編集]
  1. 無料アクセス解析
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。