記事

AMD Ryzenの「Zen 3」と「Zen 4」アーキテクチャ

Zen 3とZen 4の位置づけ

AMDは、次世代CPUコアアーキテクチャ「Zen 3」を市場に送り出す。Zen 2から1年で次のマイクロアーキテクチャへとステップアップする。

AMDのMark Papermaster氏(Chief Technology Officer and Executive Vice President, Technology and Engineering, AMD)は、Zen 3について「(Zen 2と)同じ7nmプロセスノードで、より高い動作周波数、より高いIPC(Instruction-per-Clock)と設計上の向上を達成した」と説明する。

Zen 3は、一言で言えば、Zen CPUコアの内部マイクロアーキテクチャを拡張し、クラスタアーキテクチャを刷新することで、IPC(Instruction-per-Clock)を引き上げ、キャッシュ効率を上げて大きなワークロードの性能を引き上げたバージョンだ。

ただし、Zen 3はZen 2と同じ7nmプロセス世代であるため、トランジスタバジェット(利用できるトランジスタ数)を大幅に増やせるわけではない。7nmプロセス自体の改良の効果はあるが、プロセスノードが変わるほどのインパクトはない。

プロセスノードを考えると、トランジスタ数を大幅に増やすことが可能な5nmプロセスの「Zen 4」がメジャーチェンジとなる。それに対してZen 3は、プロセス技術の制約のなかで、最大限性能を引き上げたのバージョンと言えそうだ。

一般的に考えれば、トランジスタ数が大幅に必要となるような拡張はプロセスノードが変わるZen 4で、小幅の拡張で性能を引き上げる効果が大きいものはZen 3へ振り分けるのが普通だ。

たとえば、7nmプロセスへ移行したZen 2で、大幅なトランジスタ増加が必要となる浮動小数点SIMD(Single Instruction, Multiple Data)演算ユニットの強化が図られている。

言い換えれば、AMDのZenラインナップは、次のZen 4で、さらに大きなチェンジが予想できるということだ。AMDのCPU開発パイプラインは、現在ファウンドリ側のプロセス技術と同期して、うまく回っており、ノード毎に大きな変更が、中間で改良アーキテクチャが登場している。

19%のIPCアップリフトを達成

Zen 3のアーキテクチャの変更では、CPUコア自体だけでなく、CPUコアのクラスタである「Core Complex (CCX)」のアーキテクチャを変更してキャッシュトポロジーを変えた。これは非常に大きな変化だ。

Zen系CPUコアは、これまで4個のCPUコアで1個のCCXクラスタを構成していた。4CPUコアでL3キャッシュを共有し、CCX間のコヒーレンシはCCX間のバスを経由して取っていた。そのため、4CPUコアをはみ出すワークロードの場合は、L3キャッシュレイテンシが性能を削ってしまうケースが発生していた。

CCXの変更は、ゲームやコンテンツ作成などのワークロードでは影響が大きい。CCXアーキテクチャの変更は、AMDのワークロードについての考察と密接に結びつく。

Zen 3ではCPUのブーストクロックがさらに引き上げられた。これは、プロセス自体が7nmの改良版で、さらにCPUのクリティカルパスチューニングが進んだと考えればそれほど不思議ではない。しかし、たとえZen 2と同クロックであっても、クロックあたりの命令実行が最大19%引き上げられるため性能は上がる。

AMDのMark Papermaster氏は、Zen 3での19%のIPCの内訳を示した。下のスライドがそれだ。

キャッシュへのデータ先読みの「キャッシュプリフェッチング(Cache Prefetching)」の改良が19%のうち2.7%程度、「実行エンジン(Execution Engine)」の改良が3.3%程度、「分岐予測(Branch Predictor)」の改良が1.3%、内部命令キャッシュ「マイクロopキャッシュ(Micro-op Cache)」の改良が2.7%、「フロントエンド部(Front End)」の改良が4.5%強、「データのロード/ストア(Load/Store)」の改良が4.5%弱とされている。

これを、CPUの機能ブロックで切り分けると、フロントエンド部全体でのIPC向上が約8.5%、実行エンジンが約3.3%、データムーブメントが約7.2%となる。つまり、Zen 3の強化は、実行エンジン部ではなく、フロントエンドとデータムーブメントにある。実行エンジン部が大きく拡張されたZen 2とはかなり異なる比率となっている。

Zen 3のマイクロアーキテクチャ拡張

Zen 3の実行エンジンでは、浮動小数点演算系ユニットと整数演算系ユニットが「よりワイドになった」(Papermaster氏, AMD)と説明された。

ただし、スライドでは「よりワイドな(命令)発行(wider issue)」となっている。スライドのとおりなら、実行ユニットを増やしたというより、実行ユニットが分離されて命令発行ポートが分離されたように受け取れる。

下はZen 2のマイクロアーキテクチャだ。整数演算/ロード/ストア系が7ポート、浮動小数点演算系が4ポートでスケジューラが分離された構造になっている。AMDの示すIPCの向上幅を見ても、実行エンジンの寄与分は小さいため、命令ポートの分離の可能性が高い。命令発行の分離では、たとえばIntelは浮動小数点演算系でシャッフル命令の実行ユニットのポートを分離している。

現在の高性能CPUの技術的な主戦場の1つは分岐予測。AMDはZen 3でこの部分にもメスを入れたという。今回AMDはZen 3では分岐予測帯域を引き上げ、ディレイを引き下げ、“ゼロバブル”と呼んでいると説明している。

バブル、つまり、命令実行パイプラインのなかに、泡のように何も実行されないステージが発生しないように制御することになる。ちなみに、AMDのZen 2では、クイックな予測に「Hash Perceptron(ハッシュパーセプトロン)」分岐予測、長レイテンシの予測に「TAGE(テイジ : TAgged GEometric history length branch prediction)」分岐予測となっている。AMDの現在の説明では、Hash Perceptron分岐予測側の改良に見える。

また、IPCアップのリストを見ると、デコード済みの内部命令である「Micro-OP」のキャッシュも向上している。さらに、あいまいなフロントエンド部の改良がIPCに大きく寄与している。このあたりは、フロントエンドアーキテクチャの全体像がまだ明らかにされていないため、詳細はわからない。

ロード/ストアについては「ロードとストアの数を増加させた」(Papermaster氏, AMD)と説明された。ロード/ストアは、インフライトで制御できるロードとストアの数の強化と推測される。また、プリフェッチの向上がIPC向上に寄与しているが、じつはAMDはプリフェッチアルゴリズムを連綿と改良している。キャッシュ階層の変化でも影響を受ける。

5nmプロセスで製造されるZen 4アーキテクチャ

AMDのCPUは現在TSMCプロセスに乗っており、TSMCの7nmノード世代のプロセスであることは明らかだ。しかし、AMDは、Zen 3がTSMCのどの7nmプロセスかは、まだ明確にしていない。

TSMCの7nmには、最初のArFエキシマレーザー光源の液浸多重露光技術による「N7」と、EUV(Extreme Ultraviolet : 極紫外線)露光技術を部分的に使った改良版の「N7+」、N7のスペック向上版の「N7P」があり、さらにEUVをN7+より多くのレイヤで使った派生プロセスの「N6」も7nm世代になる。

Zen 3のプロセス技術については、明らかになった時点でより詳しく説明したい。

プロセス技術について言えば、Zen 3ではなく、次の「Zen 4」マイクロアーキテクチャが大きなジャンプとなる。AMDのMark Papermaster氏は、Zen 4が5nmプロセスになることを、今回、改めて説明した。

5nmはTSMCの位置づけではメジャーノードであり、プロセス移行による性能/電力アップの効果が大きい。Zen 4での5nmへの移行は、すでにAnalyst Dayで明らかにされていたが、これは順当なプロセス移行だ。

現在、シリコンファウンドリの先端プロセス競争は5nmノードに差し掛かっており、TSMCとSamsungが5nmでデッドヒートを繰り広げている。Samsungは7nmの競争でTSMCに対して不利になっているため、対TSMCで5nmに注力している。ただし、TSMCとSamsungではプロセスノードの切れ目が異なる。

TMSCの最初の7nmプロセス「N7」は液浸多重露光でやや緩めのデザインルールであり、5nmプロセスでデザインルールを縮小する。それに対して、Samsungは7nmからEUVを「ライン&スペース(配線と配線間 : Line and Space)」にフルに使っており、TSMCより縮小したデザインルールとなっている。

そして、Samsungの5nmは7nmと同じデザインルールだが、DTCO(Design-Technology Co-Optimization)によってロジックセルを縮小する。そのため、TSMCは5nmをメジャーノードと位置づけているが、Samsungは5nmを7nmからの派生ノードと位置づける。しかし、両者の5nmプロセスは、かなり近いスペックだと見られる。

TSMCとSamsungともに今年(2020年)が5nmの本格量産の年であり、すでにAppleのA14などがTSMCのN5で製造されている。パソコン向けパフォーマンスCPUは、設計時の性能チューニングに時間がかかるため、来年(2021年)のZen 4が5nm世代となるのは、自然な流れだ。

TSMCの場合、5nmプロセスの「N5」は、7nmプロセスの「N7」に対して同じ電力時に15%のスピードアップ、または同じスピード時に30%の電力低減となる。

クロックの向上が15%は少ないと思うかも知れないが、これはモバイル向けの話で、Zen 4のようなCPU製品向けにはオプションがある。高性能なコンピューティング製品向けのトランジスタオプションの「eLVT(extremely Low Vt : 超低しきい電圧)」を使った場合は、最大で25%のスピードアップを見込むことができる。

また、高性能向けには、スタンダードセルも3フィン/トランジスタのライブラリも提供する。3フィンの場合は、モバイル向けの2フィンに較べてさらに10%の性能向上を見込むことができる。

これをCPU製品に翻訳すると、5nmのZen 4世代になると、同じマイクロアーキテクチャでも、プロセスだけで、数十%の性能/電力アップを見込むことができる。さらに、ロジック回路密度が高まることで、同じチップ面積により多くのトランジスタを詰め込むことが可能になる。増えるトランジスタを使って、アーキテクチャの拡張をさらに進めることができる。

PR
レノボの14型ChromebookがAmazonプライムデーで18,800円

レノボの14型Chromebook「S330」(英語キーボード)が、Amazonプライムデーのセールで大幅割引を実施しており、32GBモデルは8,000円割引の18,800円、64GBモデルは1万円割引の22,800円で購入可能だ。

　本製品はSoCにMediaTekのMT8173C(2.1GHz)を搭載した低価格モデル。メモリは4GBで、液晶は1,920×1,080ドット。14型ながら約1.5kgと比較的軽量。インターフェイスはUSB 3.0 Type-C(ディスプレイ出力対応)、USB 3.0、HDMI出力、音声入出力などを備える。
デル、重量約1kgの13.3型などTiger Lake搭載ノート4機種

デル・テクノロジーズ株式会社は「Inspiron」シリーズから、第11世代Core(Tiger Lake)を搭載した13.3型/14型/15.6型ノートパソコン計4機種を発売した。

Inspiron 13 7000(7300)

Inspiron 13 7000(7300)は、マグネシウム合金を使用した約1kgの軽量筐体が特徴の13.3型ノート。基本構成時の税別価格はそれぞれ109,980円。

最薄部で14.98mmの薄型設計とするほか、4辺狭額縁デザインにより没入感を高めた。インテルEVOプラットフォームに対応し、Thunderbolt 4のサポートに加えて、高い処理性能や即時復帰、長時間のバッテリ駆動、急速充電などを実現する。

基本構成時のおもな仕様は、Core i5-1135G7、8GBメモリ、256GB M.2 NVMe SSD、13.3型フルHD(1,920×1,080ドット)非光沢液晶、Windows 10 Homeなどを搭載。

インターフェイスは、Thunderbolt 4、USB 3.0×2、Wi-Fi 6、Bluetooth、HDMI 2.0、720p Webカメラ、指紋認証センサー(電源ボタン一体型)、microSDカードスロット、音声入出力などを備える。

本体サイズは304.1×197.65×14.98～16.5mm(幅×奥行き×高さ)、最小重量は999g。

Inspiron 5000シリーズ

Inspiron 5000シリーズからは、13.3型の「Inspiron 13 5000(5301)」、14型の「Inspiron 14 5000(5402)」および15.6型の「Inspiron 15 5000(5502)」の3機種を用意。基本構成時の税別価格は13.3型が81,980円、14型/15.6型が84,980円。

ともにアルミ製筐体を採用したノートパソコン。第11世代Coreを搭載するが、Thunderbolt 4には非対応となる。Inspiron 15 5000(5502)では、オプションでM.2 NVMe SSDが2台搭載可能で、RAID 0/1によるディスクアレイも構築できる。

基本構成時のおもな仕様はInspiron 13 5000(5301)の場合、CPUにCore i3-1115G4、Inspiron 14 5000(5402)およびInspiron 15 5000(5502)の場合、Core i5-1135G7を搭載。そのほか共通で8GBメモリ、256GB M.2 NVMe SSD、Windows 10 Homeなどを備え、液晶解像度はともにフルHDとなる。

インターフェイスも共通で、USB 3.1 Type-C、USB 3.0×2、IEEE 802.11ac対応無線LAN、Bluetooth、HDMI 1.4、HD Webカメラ、microSDカードスロット、音声入出力などを備える。

本体サイズ/最小重量は小さい順に、305.96×203.4×15.85mm(同)/1.053kg、321.3×216.15×16.74～17.9mm(同)/1.429kg、356.1×234.5×14.15～17.9mm(同)/1.714kg。
ASUS、BMW Designworksとのコラボデザインを施した15.6型ゲーミングノート

ASUS JAPAN株式会社は、15.6型ゲーミングノートパソコン「ROG Strix G15 G512LU」を直販にて発売した。27日より一部量販店での取り扱いも開始する。税別価格は145,273円。

ROG Strix G15 G512LUは、BMW Designworksとのコラボレーションによる独自デザインを施した製品。CPUにCore i7-10750H、GPUにGeForce GTX 1660 Tiを搭載し、前者にはThermal Grizzly製の液体金属グリスが使用されている。

従来のものからブレードの厚みを33%薄くして枚数を83枚に増加させた冷却ファンと、0.1mm厚の薄型放熱フィンを組みあわせ、動作音を抑えながらエアフローを高めた。ほこりをたまりにくくするアンチダストシステムも備える。

そのほかおもな仕様は、16GBメモリ、512GB PCIe SSD、144Hz駆動対応15.6型フルHD(1,920×1,080ドット)非光沢液晶、Windows 10 Homeなどを搭載。

インターフェイスは、USB 3.1 Type-C、USB 3.0×3、Gigabit Ethernet、Wi-Fi 6、Bluetooth 5.0、HDMI、音声入出力などを装備。タッチパッド部にはテンキー機能も備える。

本体サイズは360×275×21～25.8mm(幅×奥行き×高さ)、重量は約2.32kg。バッテリ駆動時間は約8.2時間。
Razer、13.3型ゲーミングUltrabookを第11世代Coreに刷新

Razerは、“13.3型ゲーミングUltrabook”こと「Blade Stealth 13」を第11世代Coreに刷新した。

厚さ15.3mmの薄型筐体にGeForce GTX 1650 Ti Max-Q(4GB)の搭載、120Hz/フルHDまたは60Hz/4Kタッチ対応ディスプレイなどの機能はそのままに、CPUを第10世代Core(Ice Lake)から第11世代Core(Tiger Lake)に刷新したモデルとなる。

ベース仕様は共通で、CPUにCore i7-1165G7、メモリ16GB、ストレージに512GB SSD、GPUにGeForce GTX 1650 Ti Max-Q(4GB)、OSにWindows 10 Homeを搭載。米国での直販価格は、120Hz/フルHD液晶搭載モデルが1,799.99ドル、60Hz/4K液晶搭載モデルが1,999.99ドルとなっている。パネルはOLEDも選択可能。

インターフェイスは共通で、Thunderbolt 4×2(電源共有)、USB 3.0×2、Wi-Fi 6、Bluetooth 5.1、720p/Windows Hello顔認証対応Webカメラ、音声入出力などを搭載する。

本体サイズは304.6×210×15.3mm(幅×奥行き×高さ)、重量は1.41kg。

プロフィール

HN：

angel

性別：

非公開

記事

プロフィール

カテゴリー

最新記事

RSS

リンク

P R