このページでは Intel と AMD 、どちらのプロセッサを搭載したワークステーションを選択すればよいか、判断に必要なポイント、一般的に多いであろう誤解について説明します。
目的にあった3DCGワークステーションを選ぶ上で判断材料の一つにして下さい。
3DCG 制作において、レンダリング・パフォーマンスに優れたCPUは、制作全体の作業効率を大きく改善します。レンダリングは最終計算だけでなく、確認のために繰り返し行うからです。3DCG制作を行う上でレンダリングの作業ウエイトが大きい以上、より短時間でレンダリングが終了するCPUを選ぶ必要があります。
浮動小数点演算に優れたCPUほど高いレンダリング・パフォーマンスが得られます。3DCGレンダリングはその代表で、科学計算、物理計算などに依存度の高いアプリケーションほど CPU の浮動小数点演算、FPU の能力に大きく影響されます。
現在のFPU能力は CPUのアーキテクチャ(設計)に大きく依存しており、Intel と AMD プロセッサを一概に比較する事は出来ません。過去に両者の浮動小数点の計算能力は抜きつ抜かれつであり、ワークステーションを導入する際は、現行CPU、それぞれのプロセッサの特徴を把握して決める必要があります。
3DCG制作を行う上でレンダリングの作業ウエイトが大きい以上、CPU においては、整数値演算よりも浮動小数点演算に優れたCPUの方が、より3DCG制作に適している考えて良いと思います。
動画のエンコーディング、ビジネス・アプリケーション、一般のグラフィックス・ソフトウェアは整数演算に優れたCPUが適しています。特にサーバー用途など I/O 性能が要求される分野では、整数演算に優れたCPUに武があります。
例えば Pentium 4 移行の Intel CPU は、L2-Cache 容量が多いとパフォーマンスに影響が出やすいと言われますが、ディスク・パフォーマンスなど I/O に関連する部分が多く、浮動小数点の計算能力にはあまり影響は出ません。
これらの処理に大きく影響するのは CPU の内部キャッシュ容量で、Opteron や Xeon プロセッサが高い性能を示しますが、上記、浮動小数点演算が重視される 3DCG レンダリングにおいてはあまり恩恵はありません。
3DCGワークステーションにおいて、Opeteron や Xeon プロセッサが採用される理由は、マルチCPU 構成が可能である、並列計算に重点が置かれるためです。マルチコアCPUの普及によって、Opteron や Xeon はレンダリング・サーバー向けという位置付けに置き換わると考えて宜しいかと思います。
Opeteron や Xeon が浮動小数点演算に劣るという訳ではなく、整数演算性能が上乗せされていると考えればよいかと思います。
Pentium 4 移行の Intel プロセッサのアーキテクチャは、L1 Cache より L2 Cache の容量が大きいほど高いパフォーマンスが得られますが、L2 2MB と 4MB の同一クロックのCPUを比較した場合、I/O 性能、ディスクアクセスは L2 Cache の多い方が高い性能を示しますが、3Dレンダリング の実測値においては差はあまり出ません。 .
以下の記事では Xeon 5060 (3.2GHz) x 2個 (物理的には4コア HT により8コア)、つまり、2コアCPU ×2個構成で CINEBENCH 2003(古い) を使用したスコアは 987 となっています。
こちらで自作した Core 2 Duo E6400@3.2GHz (2コアCPU&オーバークロック) の CINEBENCH 2003 の結果は 1000 を僅かに超えます。(R10ではスコア5600ぐらい) 物理コア総数4コアの Xeon に勝っています。
OC は定格電圧 FSB を上げるものでメモリ性能(Super π 104万桁 18秒)もかなり出ており、対する Xeon は 二つのCPUでメモリを共有しているなどを考慮しても、2コアが Xeon 4コアと同じというのは驚きです。ついでに 4コアCPU×1個構成
Core 2 Quad Q6600 と Core 2 Duo E6400@3.2GHz を比較した場合、CINEBENCH のスコアは妥当な数値となっています。Xeon 5060 搭載のワークステーションなら最小構成でも 50万円 程度しますから、当時 CPU 2万8千円で組んだ2コア自作ワークステーションの方がレンダリングが速いという事になります。
オーバークロックの経験のある方は、よく分かると思うのですが、CPU の動作クロックは、CPU の動作倍率×FSB周波数で決定します。
例えば、FSB266MHz と CPU倍率10倍のCPU では、266×10 = 2660MHz の動作クロックとなります。FSB133MHz と 20倍の動作倍率のCPU では 133×20 = 2660MHz で同じ動作クロックとなりますが、FSB 周波数の高い方が レンダリング・パフォーマンスは大幅に高くなります。
つまり、FSBを落として倍率を上げるオーバークロックは、仮に動作クロックが上がっても、3DCGレンダリング・パフォーマンスは大幅に低下します。現在、Intel CPU は 1033MHz から 1333MHz への移行期にあるため、これらも配慮してワークステーションを選ばれると宜しいかと思います。
大幅な性能向上という訳ではないので、2007年 12月 現在は1033MHz の価格のこなれた CPU の方が明らかにコストパフォーマンスは高くなります。(移行期の初期CPUは価格が高く、急ぎでなければ大幅に値下がりするのを待つのが上策)
Intel / AMD どちらが3DCG制作に適しているかは、CPUの設計に大きく依存するため、新しい設計のCPUが登場する度に力関係が変わる可能性があります。
Intel の最初の2コアアプローチは、従来の1ダイ1コアCPUを二つ合わせたアプローチとなっていました。市場に早く出荷する必要があったためですが、唯でさえ消費電力の高かったPentium4 を強引に一つ(Pentium D)にした訳ですから発熱、消費電力も半端ではなく性能面でAMDが大きくリードします。
しかし、後に登場する本命の1ダイ、2コア である Intel の Core 2 アーキテクチャでは、消費電力、性能面で大きく AMD を引き離し、特に浮動小数点演算で AMD のアーキテクチャを大きく上回ります。ここの記事は社交辞令のマーケティングではなく本当にインパクトがありました。2007年 12月現在もこの力関係は続いています。
AMD の Quad(4)コアアプローチは2コアCPUを二つセットにするアプローチとなっており、Core 2 Duo を二つ組み合せた1ダイ2コア×2 の Intel Core 2 Quad CPU と力関係は同じでした。(メモリのアドバンテージは殆どでなかった)
また、将来的に早い段階で 8コアへ移行できる、CPU毎にメモリが独立しているため高価なレジスタードメモリを必要としないといったメリットがありますが、将来4コアCPUが現行のマザーボードでそのまま使える保証はありませんし、機能面で制限される可能性もあります。
8コア以上の構成は既にレンダリング・サーバー用途であり、3DCGワークステーションとしては適さない構成になってしまいます。
Intel の Core 2 Quad アプローチは Pentium D と同じ二つのダイを乗せたアプローチですが、1ダイ2コアの Core 2 Duo は消費電力、性能面で優れている、早い段階で市場に出荷した、Core 2 Duo からアップグレードできるという理由で Quad CPU は Intel に軍配が上がりました。
しかし、AMD の本命は 1ダイ4コア CPU であり、1ダイ2コア×2 の Core 2 Quad を大きく抜き返す可能性があります。以下の記事によれば、このアーキテクチャーは従来の2倍の浮動小数点演算性能を持つとされています。
そして、私が最も注目していたコンシューマー向けAMDのネイティブ4コアCPU Phenom が出荷されインプレッションも出ています。注目はCINEBENCHのレンダリングパフォーマンスです。
だめじゃん。
Q6600 にクロック面で劣るにしても、今後登場する上位モデルも近い設計にあるため Intel を抜き返すというより、少し近づいたという印象を受けます。上記、記事にもあるように 64bit 環境においては、AMD プロセッサの方が伸びるため、僅かながら逆転する可能性もあります。そういう訳でして新設計CPUへの期待は一喜一憂です。
消費者にとって Intel と AMD は抜きつ抜かれつの良い関係にあり、今の所、3DCGレンダリングに重要な浮動小数点演算能力は Intel CPU (Core2アーキテクチャ) という事になります。Xeon と Opteron を比較した場合も基本設計が近いため、同じになるといった感じです。
ここで説明した内容は 2006年~2007年 12月末の状況であり、おそらくは2008年中盤までは続くと思われます。この業界は技術進歩の速い分野ですので数年後にはなんの参考にもなりません。
次のページで3DCGワークステーションを選ぶ上で3DCG制作にあった CPU を選ぶための判断方法を示します。(といっても AMD か Intel のどちらかですが)