その他の特集(2011年) | |||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|||
|
|
||||||||||||||
|
||||||||||||||
TEXT:鈴木雅暢 | ||||||||||||||
|
||||||||||||||
|
||||||||||||||
ここではキャッシュのパフォーマンスとその影響について確認してみることにしよう。下に掲載したグラフは、Sandra 2009 SP2に含まれるCache and Memory Benchmarkの結果である。このテストは、ブロックサイズ別にデータ転送を行なって帯域を計測するテストだ。グラフは縦軸が性能(帯域)で、横軸がブロックサイズを示している。1次/2次/3次、それぞれのキャッシュに収まる範囲のブロックサイズの場合はそれぞれのキャッシュの性能、それを超えた部分はメモリの性能ということになる。 このグラフは形をざっくり見るだけでも「小サイズではIntel CPUが高速」であるとか「Core 2 Quadは256KBではほかより遅いが、4MBでは逆に速い」といったようなおおまかな特性が掴めると思うが、より細かく見るには少々予備知識が必要になる。今回は下に各CPUのカバー範囲を明示しているが、CPUごとのキャッシュ容量を把握した上でカバー範囲を考えながら見ると、各CPUのキャッシュの性能を知ることができる。 ただ、キャッシュのカバー範囲に関しては注意が必要で、マルチコアCPUでコアごとにキャッシュを内蔵する場合は、各コア合計のキャッシュ容量がカバー範囲となる。たとえば、Core i7の2次キャッシュは256KBだが、4コアあるために256KB×4=1MBが2次キャッシュのカバー範囲となる。そして、各キャッシュにデータを重複して持たないエクスクルーシブ方式のキャッシュを採用するAMD CPUの場合は、下位キャッシュのカバー範囲に上位キャッシュの容量も足して考える必要がある。たとえば、Phenom IIの場合は1次データ+2次+3次の合計で8.25MBが、3次キャッシュのカバー範囲となる。 さらに、キャッシュのカバー範囲の境目の部分は、どのCPUでもスコアが少し落ち込む傾向がある。たとえば、Core i7/Core 2 Quadの128KBはその前の64KBに対して、同じく1次データキャッシュのカバー範囲であるにもかかわらず少し落ち込んでいる(Core i7は変動が激しいので目立たないかもしれないが)。これはこのテストが256KBなら256KBきっちりのブロックサイズでデータ転送をしているため、転送中にごくごくわずかな割り込みが発生した場合でも一部がキャッシュから漏れてしまうのだと思われる(あくまで推測である)。昔からどのCPUでも境界の部分では落ち込みが見られるので、この点についてはあまり気にする必要がないだろう。 もう一つ、コアに内蔵されるキャッシュはコアのクロックに同期して動作するため、アーキテクチャが同じであれば、動作クロックの高いCPUのほうがキャッシュも高速になるのが自然である。 なお、下に掲載したグラフは、同じSandra 2009 SP2のCache and Memoryのデータから、各CPUのキャッシュカバー範囲の数値をピックアップして平均し、1次データキャッシュと2次キャッシュ、3次キャッシュの速度を算出して比較したものだ。折れ線グラフの形状と合わせて見てほしい。 前置きが長くなったが、上記のことを踏まえた上で各CPUの傾向を見ていこう。2.6GHzにダウンクロックしたPhenom II X4 940 BEとPhenom X4 9950 BEは、若干の上下があるもののほぼ同じ性能。Phenom IIの3次キャッシュのカバー範囲は8.25MB(0.25MB+2MB+6MB)なので、テスト内容に8MBというブロックサイズがあればよかったのだが、Phenomの3次キャッシュのカバー範囲内である4MBの次は16MBに一気に上がってしまっているため、グラフ上ではPhenomとPhenom IIの差がほとんど分からない。それでも16MBのサイズではPhenom IIがPhenomに比べて11%高速で、一応キャッシュ増加の効果は見て取れる。 前項のメモリ帯域幅もそうだったが、Phenom IIの3次キャッシュとメモリの性能は3GHzでも2.6GHzでもほとんど差がない。このことから、3次キャッシュとメモリコントローラ、いわゆるPhenom IIのアンコア部はCPUコアとは別のクロックを基準に動作しており、それはCPUコアクロックが異なっていても同速度であるということが見て取れる。そして、2.6GHz同士でPhenom IIとPhenomの3次キャッシュとメモリ性能とを比較してみると、Phenom IIのほうが若干だが上であり、メモリ帯域幅でもPhenom IIのほうが上回っていた。つまり、Phenom IIではこのアンコア部の性能が少しだが上昇していると判断できる。細かい話で恐縮だが、これがAMDの言うIPC向上の要因ではないかと思われる。 |
||||||||||||||
|
||||||||||||||
Intel CPUの比較も各CPUの特性の違いが見えてなかなかおもしろい。Core i7とCore 2 Quadは1次データキャッシュ容量が同じだけに、2次キャッシュ速度の違いが顕著に分かる。Core 2 Quadの2次キャッシュは容量が多いものの、Core i7の50%程度の速度しかなく、Phenom IIよりも21%遅い。バランス的にギリギリといった印象で、Core i7でキャッシュ構造をPhenom II/Phenomと同じ3レベルに改めたのも納得できる話だろう。CPUのコアクロックがほぼ同じなのにCore i7よりもPhenom IIのほうがキャッシュ性能が明らかに遅いのは、Phenom IIはエクスクルーシブキャッシュのために、内容入れ換えのオーバーヘッドが生じているためだと思われる。それでも、CPUコアの動作クロックが2.6GHzから3GHzに上昇したことで1次データ/2次キャッシュともに約17%のスピードアップがなされ、Core i7に対しては見劣るものの、全体的に見ればCore 2 Quad以上のキャッシュ&メモリ性能を持っていると言ってもよいだろう。 | ||||||||||||||
Phenom IIとPhenomについては、PCMark VantageとCINEBENCH R10のグラフも掲載した。2.6GHz同士でPhenom IIとPhenomの違いを見ることと、Phenom IIの3GHzと2.6GHzでどのくらい性能が違うのかを確認するのが目的である。2.6GHz同士の比較では、PCMark Vantageで3.4%、CINEBENCHでは2%、Phenom IIのほうが高速だった。CINEBENCHのようなCPUコアへの負荷が高いソフトではキャッシュ性能が反映されにくいことを考えれば、十分価値ある成果と言える。また、Phenom II同士の比較では、PCMark Vantageで10%、CINEBENCHでは15%も3GHzのほうが高速。さらにPhenom II X4 940とPhenom X4 9950の比較ではPCMarkで14%、CINEBENCHでは17%の性能向上を果たしている。 結局のところPhenom IIの高性能は動作クロックの向上が大きな決め手となっているわけだが、アーキテクチャ的なポテンシャルの高さがクロック向上によって活きてきたと言えるかもしれない。 |
||||||||||||||
|
||||||||||||||
|
発売日:12月28日
特別定価:2,310円
発売日:2022/11/29
販売価格:1,800円+税
発売日:2019/05/29
販売価格:1,780円+税
発売日:2019/03/25
販売価格:1,380円+税
発売日:2018/02/28
販売価格:980円+税
発売日:2017/03/17
販売価格:1,680円+税
発売日:2016/09/23
販売価格:2,400円+税
発売日:2016/03/29
販売価格:1,480円+税
発売日:2015/12/10
販売価格:1,280円+税
発売日:2015/06/29
販売価格:2,500円+税
発売日:2015/06/29
販売価格:2,500円+税
発売日:2015/02/27
販売価格:980円+税
発売日:2014/12/05
販売価格:1,280円+税
発売日:2011/12/22
販売価格:980円+税
アンケートにお答え頂くには「CLUB IMPRESS」への登録が必要です。
*プレゼントの対象は「DOS/V POWER REPORT最新号購入者」のみとなります。
ユーザー登録から アンケートページへ進んでください