Larrabee妄想

http://www.4gamer.net/games/049/G004963/20091212001/

演算処理性能でも一世代前のハイエンドグラフィックス製品に及ばない状態だった」と,同製品のエンジニアリングサンプルを供給されていた複数のデベロッパ関係者が証言している。

Intel(以下I) : 「ららびーです」
デベロッパ(以下D) : 「ありがとう」
D : 「ちょ、これ、ゆっくりなんですけど…」
I : 「タイリングとか、ビニングとか、すれば、はやくなりますよ」
D : 「タイリングてなんですか?」
I : 「タイリングは、タイリングです。データを小さく切ります」
D : 「小さくって何よ?」
I : 「小さくは小さく、です。ここにららびーのキャッシュの構造について書いたマニュアルがあるので読んでください」
D : 「200ページて」
I : 「これからはマルチコアの時代です。このぐらい読んで当然です」
D : 「200ページて…ひとことで説明すると?」
I : 「データを、小さく、切ります」
D : 「そればっかり!小さく切るて、どのくらいに切ればいいの?」
I : 「256KBです!」
D : 「256KBて!ちょびっとやん!」
I : 「ちょびっとではない!ここに、水が半分入ったグラスがあります。これを見て、残り128KBしか無い、と考える人と、全部で256KBしか無い、と考える人と、どちらが幸せになれるかわからんのか!」
D : 「どっちもあんまり変わらん!」
I : 「まあ、ともかく、タイリングして、PCI Expressを通るデータを圧縮して、ちょびっとオーバークロックすれば1TFlops出るんです。すぐです」
D : 「すぐではない!」

DirectX APIを使った時の挙動とかどうなってたか全然予想できないけど。

「並列言語が重要である」とかよく言うが、並列だけでなくて、ループタイリングに耐えられる言語仕様の設計とかも重要なのであり、今のところループタイリングとかループ融合とかに耐えられる言語は恐らくFortranぐらいである。