.
トップページ

環境 ~ハードウェア

3DCG Workstation


3DCG-WSに関する説明

環境 ~ソフトウェア

取り扱いショップ

ベンチマーク・ツールによる比較と注意点 ~ CINEBENCH

3DCGワークステーション導入アドバイス

3DCG制作者にとって最も気になるのが、AMD / Intel プロセッサの浮動小数点演算能力、つまりFPUの性能です。レイトレーシング、ラジオシティ系レンダリングにおいては、これらの性能がレンダリング・パフォーマンスに大きく関係するからです。

浮動小数点演算能力の高いCPUの見極め方

2007年 現在、マルチコアCPU の FPU 能力は Intel の Core 2 アーキテクチャに軍配が上がります。しかし、Intel と AMD は抜きつ抜かれつの競争を繰り返しており、ワークステーションを購入する場合はその都度調べて判断する必要があります。

AMD / Intel どちらのアーキテクチャ(設計)が 浮動小数点演算(FPU)能力の高いか見極める方法と注意点について説明します。

同一アーキテクチャであれば、概ねクロック数に比例

現在のCPU性能評価はCPU のクロック数 = 絶対的な性能 ではなくなっています。同一クロック数の AMD と Intel プロセッサを比較するのではなく、一般の方は同一価格帯の現行のCPU同士で比較すると考えて頂くと分かり易いと思います。

どのCPUを比較すればよいかは、ネットで公開されているベンチマーク情報は競合するCPU 同士を比較する事が一般的であるため、一般の方でもおおよその見当は付くと思います。

基本的に同一プロセスで製造された同じアーキテクチャを持つCPUであれば概ねクロック数に比例します。ですので、現行の AMD / Intel プロセッサのFPU能力はどちらが優れているかは直ぐに結論が出ます。

余談ですが、同一プロセスの価格を抑えた CPU 程、オーバークロックの際の伸び代が高くなるお買い得CPUとなる傾向があります。(特にCore 2) お買い得といってもオーバークロック前提なのでお勧めできませんが。

CPU 拡張命令セット.

Intel は SSE、AMD は 3DNow! という拡張命令セットを持っています。よく利用される処理を事前にCPU側で予約しておくことで処理能力の向上を図る技術です。この恩恵を得るには使用するアプリケーションが、SSE/3DNow! に対応している必要があります。

これらの拡張命令には 3Dレンダリングに関連の深い浮動小数点演算に関係する命令セットが含まれており、最適化されたアプリケーションであればレンダリング処理能力が向上します。下の図は AMD と Intel プロセッサが対応している拡張命令を調べた結果です。CPUの価格帯によって対応している命令セットが異なる場合もあります。

CPUID-AMD   CPUID-Intel

関連 => CPU とマザーボードの確認方法 ~ XP Professional x64

AMD は Intel 互換プロセッサである事

2008年に出荷が始まる Intel の45nmプロセス Wolfdale (2コア)/ Yorkfield (4コア) プロセッサでは、更に命令セットが拡張された SSE4 となりますが、AMD は Intel の互換プロセッサという立場上、どうしても SSE の実装は遅れてしまいます。

例えば、SSE3 の修正版である SSSE に対応する AMD プロセッサは現在の所ありません。3dsMaxではレンダリングオプションでSSEを有効にするかしないかの設定が用意されている3DCGソフトもあります。

AMD も 浮動小数点演算に優れた 3DNow! を持っていますが、SSE を実装するアプリケーションが多いためなのかも知れません。 SSE/3DNow! どちらかという話ではなく両方をサポートするアプリケーションも多く存在します。

ベンチマークツールに関して

浮動小数点演算の性能を調べるベンチマークソフトは沢山あります。例えば、Super π(円周率計算)、HDBENCH 、SiS Sandra など。特に、Super π や HDBENCH などは行っている処理がシンプルであるため、3DCGレンダリングにおける性能評価には殆ど参考になりません。

ベンチマーク・ツール CINEBENCH.

CINEBENCH R10

現在、出荷されている AMD/Intel プロセッサの3DCGレンダリング適正を検討する上で参考になるのが、CINEBENCH のベンチマーク結果です。

このツールはCINEMA 4Dのレンダリング・エンジンをもっており、シングルコア、マルチコア(並列計算)のレンダリング速度を計測する事が出来ます。

Google で 目的の CPU と CINEBENCH で検索してみると情報が得られます。現在使用しているパソコンと公開されている CINEBENCH の結果を比較してみるのも良いと思います。以下から入手する事が出来ます。

入手先 => MAXON - The makers of CINEMA 4D and BodyPaint 3D

並列計算が可能であるため、マルチCPU、マルチコアCPU のレンダリング・性能を比較する上で都合が良いためです。ただし、注意点もあります。(後述)

CINEBENCH の注意点

所詮はベンチマーク・ツールであるという事を忘れてはいけません。3DCGレンダリングといっても様々な計算方式があります。レンダリングするシーンによっては、Intel より AMD プロセッサが高いパフォーマンスを示す可能性があるという事です。

レイトレーシング / ラジオシティ (フォトリアル系)

CINEBEHCH の目安は レイトレーシングラジオシティ系のレンダリングの性能です。これらのレンダリング方式をメインで使用する 3DCG制作を行われている方は、CPUの性能を判断する上で目安になります。

セルアニメ 映像制作 (ノンフォトリアル).

セルレンダリングは、上記、フォトリアル系レンダリングと違い、屈折や反射といった複雑なレンダリング・パスを必要としません。そのため、上記レンダリング(計算)方式に比べ短時間でレンダリングが行えます。

最近の例では、FREEDOMが良い例ではないかと思います。(LightWave 3DHPのワークステーションで制作されている) このような映像制作ではアニメーターが書き起こしたイメージをテクスチャーとして利用するケースが多くなります。

HD放送であれば、より多くの高解像度テクスチャが必要となるため、x64環境下ではメモリ帯域でアドバンテージがあり、64bit 性能向上の高い AMD プロセッサ搭載ワークステーションが適している可能性もあります。

3DCG レンダリングといっても制作内容によって様々であり、これらも総合的に判断する必要があります。所詮はベンチマークソフト、それ以外の性能は推し量る事は出来ないという事です。

実際に確認した訳ではありません。あくまで個人の推察です。

CINEBENCH のバージョンの違い

ネットで見かける CINEBENCH のバージョンは、2003(R8) / 9.5 / R10 が使用されています。右に行くほどバージョンが新しくなります。2003 ~ 9.5 は同じシーンが使用されていますが、レンダリング・エンジン、最大並列処理数や最適化されるCPUの種類にも違いがあります。

過去のCPUとの比較で古い2003を使用するのは分かりますが、出来れば最新のR10のレンダリング結果で検討したい所です。(特に拡張命令セットの対応状況、最適化によりレンダリングパフォーマンスが大幅に変わる可能性は否定できない)

R10 ではレンダリングに使用するシーンが刷新され、レンダリング・エンジンもより現在のCPUにあった改良が行われているため、単純に比較できる訳ではありません。レンダリング・エンジンもより、効率的に計算が行えるよう改良が続いているからです。

ちなみに最新の R10 では 16スレッド 、2003/R9.5 では8スレッド、2003では4スレッド。余ったスレッドは使いきれていないCPUを使用する可能性もあり、4スレッド環境でも16スレッドでレンダリングした方がレンダリング速度を引き出せる可能性もあります。レンダラの SSE 最適化も異なると考えられます。

これらを無視して得られるベンチマーク結果は、あくまで異なるCPU同士の相対的なパフォーマンス比較であり、必ずしも3DCG制作者が期待する性能を示している訳ではない事に注意する必要があります。それでも目安としては大いに参考になります。

スレッド数とレンダリング速度は必ずしも比例しない

並列計算の能力は、プログラムの出来にかかっています。仮に1コアと2コアを比較しても単純に2倍にはなりません。レンダラによっては1.5倍、良くても1.8倍程度です。CINEBENCH の測定結果はこのシーンに限定されたものである事に注意が必要です。

3DCGレンダリングといっても、使用するシェーダーやプラグイン、設定によっては並列計算が行えないものも多くあります。この場合、CPUは全てを使い切る事は出来ません。CINEMA 4D のレンダリング・エンジンを持つ CINEBENCHE ですが、これらの要素は全て排除されているため、CPUを使い切る事が出来るのだという認識は必要です。

アプリケーション並列処理最適化の確認

マルチコア、マルチCPUを搭載したワークステーションを導入する場合は、目的のアプリケーションが、並列処理に対応しているか確認するようにして下さい。

といっても、ベースのレンダリング・エンジンだけでなく、シェーダー、ボリューム・エフェクトなど拡張モージュール、物理計算エンジン等、全てが並列処理に高度に最適化されていなければ、マルチコア、マルチCPUの恩恵はフルに得られません。

特定のレンダーパスでCPUを使い切れていない例

タスクマネージャー負荷50%

CPUが使い切れている状態

タスクマネージャー負荷100%

これらの情報は公開されない事が多く、ソフトウェア・ベンダーに問い合わせた所で明確な回答が得られるとも思えません。実際に実機で試してみなければ正直分からないという所です。並列処理に馴染みのない方は、タスクマネージャーとレンダリング状況の睨めっこになると思います。(特に映像制作)

3dsMax の例

3dsMax は独自のスキャンライン・レンダラと MentalRay の二つのレンダラを持っていますがスキャンライン・レンダラにおいてはQuad コアCPUの恩恵が出ていません。

参照 => How to make MAX use 2 cores?

MAYAも 3dsMax と同じくMental Ray以外に独自のレンダラを持っていますが、MentalRay に重点が置かれているため、独自レンダラの進化は殆ど止まっています。このように使用するレンダラによっても対応しているスレッド数やマルチスレッド最適化は異なります。

マルチスレッドの最適化に関する情報はマルチコアCPUが普及した現状ではソフトウェア・ベンダーは積極的に情報を公開して欲しいですね。

参考Link

CPU の3DCG レンダリング性能を検討する上で参考になるサイトです。CINEBENCH / 3dsMax / POVRAY あたりが参考になります。

PC消費電力の概算を算出できます。

CINEBENCH の OC のベンチマークで盛り上がっています。ブルガリア語?CINEMA4D 圏でしょうか。



あけぶれ公式サイト
3DCG検索 | コンテンツ検索 | 書籍・ソフト検索 | 国内検索 |
bottom_mark
ページ最上部
ページ最上部 前のページ