その他の特集(2011年) | |||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|
||||||||||||||
|
||||||||||||||
TEXT:鈴木雅暢 | ||||||||||||||
|
||||||||||||||
2次キャッシュの増量に関しても、45nmプロセスルールの採用による製造技術の微細化が大きく貢献している。CPUに比べてシステムバスやメインメモリは格段に低速であり、計算に使うデータをいちいちメインメモリから読み出していたのでは、CPUの処理性能にデータの供給が追い付かない。そのために両者の中間に、少量でもCPUに近い速度で動作するメモリを配置し、メインメモリの内容をキャッシュしておくことでメインメモリへのアクセスが減り、結果的にシステム性能が高速化する。 キャッシュメモリの容量は、メインメモリの容量に比べればはるかに小さいが、小容量でも高速化につながるのは「データの局所性」という原理にもとづいている。CPUの処理を短い時間で区切ると、アクセスするメモリアドレス空間の範囲はある程度集中しているため、少量のキャッシュでもかなりの効果を上げることができる。また、最近はプリフェッチ(メモリアクセスパターンを解析して予測し、先読みする)技術もインテリジェントに進化しているため、リアルタイム3DCGやビデオストリームなど、キャッシュに収まり切らないような大きなデータを順次処理していくような場合でもキャッシュは効いてくる。 いずれにしても キャッシュ容量は大きければ大きいほどヒット率(CPUが求めるデータがキャッシュにある確率)が上がり、遅いメモリアクセスが発生する確率が下がり、結果的にシステム性能が高速化する。ただ、もともと少量のキャッシュでもヒット率が高かったアプリケーションではキャッシュが増えてもヒット率があまり上がらず、パフォーマンスアップも地味なものとなる。 なお、IntelとAMDではキャッシュまわりのアーキテクチャがかなり異なる。Intel CPUでは、二つのコアで一つの2次キャッシュを共有する。この共有キャッシュでは、二つのコアで同じメモリアドレスの内容をキャッシュしている場合にキャッシュの同一性を保つ監視のロスがなくなるメリットがある。また、二つのコアがまったく違うアドレスをキャッシュするような場合も、二つのコアで容量を等分せず、5MB+1MB(6MBの場合)といったように柔軟な使い方が可能になっている。 一方、AMDのクアッドコアCPUであるPhenomでは、128KBの1次キャッシュと512KBの2次キャッシュをCPUコアごとに備えるほか、さらに4コアで共有する2MBの3次キャッシュを搭載している。Intel CPUに比べて容量はかなり少ないが、AMD CPUでは下位のキャッシュに上位のキャッシュ内容を含まない排他的キャッシュのため、最大で1次+2次+3次の合計容量をキャッシュできる。一方、Intel系CPUでは1次キャッシュの内容を2次キャッシュにそのまま持つため、実際にキャッシュできる内容は2次キャッシュ容量のサイズに等しい。AMDの方式はデータの入れ換えの際にオーバーヘッドが発生するが、容量の効率はよい。ただ、3次キャッシュは2次キャッシュよりも速度面は不利であり、やはり後付け感が強く、現時点ではキャッシュまわりの性能で見劣りするのは否めないところだろう。 |
||||||||||||||
大容量2次キャッシュか3次キャッシュか | ||||||||||||||
AMDのPhenomでは、2次キャッシュまでを各コアそれぞれが備え、2MBの共有型3次キャッシュを搭載している。AMDのキャッシュは上位のキャッシュ内容を下位のキャッシュが重複して持たず、1次+2次+3次の合計容量がムダなく利用できる | ||||||||||||||
|
||||||||||||||
45nm世代のIntel CPUでは、SSE4.1として47命令が追加されている。この中には「MPSADBW」、「PHMINPOSUW」といった動画のエンコードの際に使う「動き検索」を高速に行なう命令が含まれており、Intelはこれを利用することで、動画エンコードにおいて高精度な動き検索にかかる時間を大幅に短縮できるとアピールしている。最新版DivXのオプションで選べる「実験用SSE4フルサーチ」というのはまさにこれを利用したものだ。もっとも、これはあくまでもSSE4.1に合わせて作ったものであり、この命令を使わずとも高精度な動き検索を高速に行なう方法はほかにもあり、現時点では汎用的なメリットとは言い難い。拡張命令については、AMDもPhenomからSSE4a、およびABMという拡張命令を追加しているが、こちらは4命令+2命令の追加。SSE4.1の一部と同等の内容も含まれているが、IntelのSSE4.1とは互換性がないため、SSE4.1とは別にアプリケーション側が「SSE4aに対応」する必要がある。 以上、AMD CPUとの比較も含めてYorkfieldをアーキテクチャから解説してきたが、これはあくまでも理屈。実際に一般的なアプリケーションでどの程度の性能向上を果たせるかについては、こちらからのベンチマークテストで確認してもらいたい。 |
||||||||||||||
DivX 6.6以降、動き検索のオプションとして「実験用SSE4フルサーチ」という項目が用意されており、「SSE4を利用可能」が選べる | ||||||||||||||
TMPGEnc 4.0 XPressもVer.4.4.0.233(2007年10月16日にリリース)からMPEG/MPEG2エンコーダがSSE4.1に対応 | ||||||||||||||
|
||||||||||||||
|
||||||||||||||
|
発売日:12月28日
特別定価:2,310円
発売日:2022/11/29
販売価格:1,800円+税
発売日:2019/05/29
販売価格:1,780円+税
発売日:2019/03/25
販売価格:1,380円+税
発売日:2018/02/28
販売価格:980円+税
発売日:2017/03/17
販売価格:1,680円+税
発売日:2016/09/23
販売価格:2,400円+税
発売日:2016/03/29
販売価格:1,480円+税
発売日:2015/12/10
販売価格:1,280円+税
発売日:2015/06/29
販売価格:2,500円+税
発売日:2015/06/29
販売価格:2,500円+税
発売日:2015/02/27
販売価格:980円+税
発売日:2014/12/05
販売価格:1,280円+税
発売日:2011/12/22
販売価格:980円+税
アンケートにお答え頂くには「CLUB IMPRESS」への登録が必要です。
*プレゼントの対象は「DOS/V POWER REPORT最新号購入者」のみとなります。
ユーザー登録から アンケートページへ進んでください