先のページで触れましたが、Core i7 以降の一般向け Intel CPU は ECCメモリ非対応となったため、2CPU 構成も可能な Xeonプロセッサをを搭載したワークステーションも選択肢に入ります。
以前にも指摘していますが、マルチコアCPUが当たり前となった現在は、Xeon のCPU構成やメーカー製 3DCGワークステーションも変化していますので再度考察します。
.Core i7 以降の CPU では、2コアCPUよりも4コアCPUの方がメリットが多くワークステーション用途に適していますが、ECCメモリに CPU が対応しないため、信頼性を優先したい場合は、Xeon+ECCメモリのワークステーションも視野に入ります。
また、Core i7 / Nehalem マイクロアーキテクチャ世代(3000 系) の CPU ではプロセスルール 45nm が主流ですが、最上位には 32nm と微細化の進んだ6コアCPUもラインナップされています。
TDP130W といえば Pentium4 や Intel 初のデュアルコア PentiumD を思い出しますが、微細化が進んでもコアを詰め込んで性能向上をアピールする必要があるため、消費電力あたりの性能は向上しています。
しかし TDP130W という事実は 1CPU構成のワークステーションでもランニングコストや環境負荷を考えると抵抗があります。
Core i7 | TDP | プロセス | コア数 | HTT | ソケット |
---|---|---|---|---|---|
Core i7 9xx (Bloomfield) |
130W | 45nm | 4 | ○ | LGA1366 (B) |
Xeon 3500番台 (Nehalem-WS) |
|||||
Core i7 9xx (Gulftown) |
130W | 32nm | 6 | ○ | LGA1366 (B) |
Xeon W3600番台 (Westmere-WS) |
|||||
Core i7 8xx (Lynnfield) |
95W | 45nm | 4 | ○ | LGA1156 (H) |
Xeon W3400番台 (Lynnfield) |
現在、巨大な CPU クーラーを必要とする TDP130W が高性能CPU という位置づけになっていますが、高い負荷が連続して発生する3DCG制作においては、いくらパワーマネジメント機能が改良されたとしても個人的には 95W がぎりぎりのラインだと思います。
将来的に Lynnfield に該当する 32nm CPUが登場してもコア数やクロック周波数があがる可能性が高くなります。性能据え置きであれば消費電力が下がりますが、それは廉価版として位置づけられるため、ユーザーやアプリケーションが性能を求める限り、TDPが現状より下がるということはありません。
いい加減、消費電力あたりの性能評価で環境性能が優れているという認識は捨てるべきです。レンダリング解像度や求める品質は留まることを知らないため、実際には 10年前と生産性が向上したという実感がないというのが現状です。消費電力あたりの性能が高ければ環境にやさしいということにはなりません。
プロセスルールの微細化が進む事で消費電力は抑えられますが、クロックを引き上げる事で性能向上を図ってきたため、高性能デスクトップ向けCPUにおいては大幅に消費電力が下がる事はなく消費電力あたりの性能向上が強調されてきました。
そもそもマルチコアに移行した理由は、微細化に伴うリーク電流の問題により高クロック化が難しくなったためであり、デスクトップ向け高性能CPUの今後はプロセスルールの微細化に伴い高クロック化よりもコア数の増加によりTDPも据え置かれる事になると予想されます。
来年登場する32nm世代では Sandy Beidge 世代では GPU を内蔵し、拡張命令セットも大幅に拡張されます。
.来年登場する Intel の一般市場向けSandy Bridge世代の CPU では 32nm プロセスへ本格的に移行しますが、CPUコアにGPUが統合されたビデオカードを必要としない従来の統合チップセットに置き換わる CPU となります。
3DCG制作者にとっては無縁のCPUですが、GPU を内蔵しないコアもそのうち登場します。(詳しくは後のページ、右メニュー参照)
この間のハイエンド1CPU構成のマルチコアCPUは、同じ 32nmプロセスで製造される Core i7 9xx (Gulftown) や Xeon W3600番台 (Westmere-WS) が受け持つことになります。いずれも TDP130W クラスのCPUです。
Bloomfield 4コアCPU と Gulftown 6コアCPUを比較した場合、マルチスレッドに高度に最適化されたレンダリングエンジンを持つ CINEBENCH で 1.4倍程度とコア数分の性能は向上しています。
CINEBENCH はマルチスレッドに高度に最適化されたレンダラであり、一般的な3Dレンダラで同じようにコア数に比例したレンダリング時間を短縮できるとは限りません。
Core i7 9xx(4コア)の下位に位置づけられる Lynnfield 4コアCPU (Core i7 8xx)も Bloomfield 4コアCPU と性能に差がないため、2万円台後半のCPU と 10万円近くする 6コアCPU は 3倍以上も実売価格に差があります。
作業用PCで 1.4倍のレンダリング性能を得るために、"3倍の価格" と "ランニングコスト" を支払うメリットが見いだせるかが判断の分かれ目です。
以下は、大手PCメーカーが扱っている3DCGワークステーションの価格です。ざっくりですが、ベースの 3GHz-4コアCPU から CPU を 3GHz-6コアCPU に変更した場合の価格差です。システム価格は10万円、1.5倍の価格差があります。
CPU そのものはレンダリング ベンチマークで1.4倍近い性能が出ていますので、システム価格は相応と思いがちですが、CPU 単体でみると3倍以上もの価格差があり、実際にはCPU単価でみれば釣り合いが取れていない事がわかります。
上記グラフは CPU が違うだけでそれ以外は全く同じハードウェアです。
パーツ単位、自作ユーザーからみれば、上位CPUに性能に見合わない価格のCPUでも1台のメーカー製ワークステーションとしてみれば性能に見合わない価格設定でも十分捌ける訳です。
また、シングルスレッド アプリケーションにおいては、TurboBoost 時の伸び率は 4コアCPU の方が高いため、3Dレンダリング以外の多くの作業は 20万円の4コアCPU搭載機の方がパフォーマンスが高い点にも着目する必要があります。
この程度の差なら、確認時のレンダリングサイズを縮小する、部分レンダリングを積極的に活用するなど工夫次第で生産性に大きな影響は出ません。3DCG ソフトには、負荷の高い処理を効率的にこなすため、レンダリング解像度を落としたり、部分的にレンダリングしたり様々な機能があります。最近の学生は湯水のようにハード資源を使っている人を見かけますが、ハングリー精神を忘れてはいけません。ハードウェアだけでなくソフトウェア側の工夫で常に生産性を考える事も忘れてはいけないという事です。そこから様々な応用力やアイデア、新しいアプローチを発見する事があります。
TDP125W と消費電力が高い上に、6コアCPU でも性能は同一クロック周波数で比較しても 3Dレンダリング性能は Core i7 (Lynnfield) 4コア CPU にも劣ります。価格相応の性能ですが、TDP125W はランニングコストを考えても選択肢には入りません。
.作業用PC としては TDP130W は消費電力の面で抵抗があり、TDP95W クラスの Lynnfield が適しています。また、下位ランクに位置づけられるためコストパフォーマンスにおいても抜き出ています。
Core i / Nehalem 3000系 世代では、改良されたパワーマネジメント機能により、2コアCPU よりも 4コアCPUがワークステーション用途に適しており、3Dレンダリングでは恩恵の大きい Hyper-Threading Technology (HTT)をサポートしたCPUがベストです。
3Dレンダリングでは恩恵の大きい Hyper-Threading Technology (HTT)をサポートする4コアCPU には以下の4つの選択肢があります。Core i7 は ECCメモリをサポートしないため、信頼性で Xeon に劣ります。
Bloomfield (Core i7 9xx) or Nehalem-WS (Xeon 3500番台)
DDR3-1066 トリプルチャンネルでメモリ性能は優れるが、3DCGレンダリングや一般的なグラフィックス分野では大きな恩恵はない。
Lynnfield (Core i7 8xx) or Lynnfield (Xeon 3400番台
DDR3-1333 デュアルチャンネルでメモリ性能で差別化されていいるが、3DCGレンダリングや一般的なグラフィックス分野でアドバンテージになることはない。
ワークステーション用途においてもっともバランスがとれているのが Lynnfield になります。上記、TDP130W の下位ラインナップに位置づけられていますが、同一クロックの Bloomfield と性能差が殆どない事から、高クロックモデルは高めの価格設定がされています。値下げした Core i7 870 が最もおすすめです。
CPU と メモリ間の帯域(QPI)の広い Extream Edition というハイエンドCPUが存在し、該当する Xeon も存在します。CPU、メモリ間の性能は 3DCGレンダリングにおける性能向上には大きな影響がないため、コストパフォーマンスは極めて悪くなります。
Intel Core i では、長年当たり前のようにサポートしいた ECC メモリの非対応にするという差別化を行ったため、前回のテーマと大きく異なるのは 3DCGワークステーションの導入を考える上で、高価な Xeon CPU を視野に入れる必要が出てきた点です。
信頼性が求められる分野、ではなく、信頼性が求められる用途、と考えた方がベターです。数日にわたって長時間レンダリングを行う場合と、シーンのライティングやマテリアル、テクスチャ制作で繰り返し頻繁に行うレンダリングでは求められる信頼性にも幅があるためです。
メーカー製ワークステーション、特に DELL では(以前はECCメモリを使わなかったくせに) ECCメモリのメリットを全面に押し出して1CPU構成の 3000系 Xeon よりも 5000系を中心としたワークステーションを展開していますが、本格的な 3DCG制作には、高価な業務用PCが必要、という敷居の高かかった時代に逆戻りしてしまいました。
以前にも紹介したと思いますが、引き続き Xeon や Opeteron など業務用という印象の強い Xeon ブランドCPU の特徴をみてみます。