35
HPE HPC & AI フォーラム 2018 日本ヒューレット・パッカード株式会社 ハイブリッド IT 事業統括 クラウドプラットフォーム統括本部 ミッションクリティカルソリューション部 藤川 智博 メモリ主導型コンピューティングが いよいよ現実に! 大容量メモリ搭載サーバーが描く 未来への軌跡

メモリ主導型コンピューティングが いよいよ現実 …...GPU ASIC Quantum RISC V メモリ 既存のプロセッサー中心のコンピューティングから …

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

HPE HPC & AI フォーラム 2018

日本ヒューレット・パッカード株式会社ハイブリッド IT 事業統括 クラウドプラットフォーム統括本部ミッションクリティカルソリューション部藤川 智博

メモリ主導型コンピューティングがいよいよ現実に!大容量メモリ搭載サーバーが描く未来への軌跡

メモリ主導型コンピューティング開発の背景:ムーアの法則の終焉?

1

0.3 0.8 1.2 1.84.4

7.9

15.8

31.6

44

0

5

10

15

20

25

30

35

40

45

50

2006 2008 2010 2012 2014 2016 2018 2020

データ(ゼタバイト)

データは2年ごとに約2倍に (2013-2020)

データの伸び

トランジスター(千個)

シングルスレッドのパフォーマンス(SpecINT)

動作周波数(MHz)

消費電力(ワット)

コア数

1975 1980 1985 1990 1995 2000 2005 2010 2015

マイクロプロセッサ

107

106

105

104

103

102

101

100

需要にコンピューターの性能が追い付かない!

メモリ主導型コンピューティング

GPUASIC

Quantum

RIS

CV メモリ

既存のプロセッサー中心のコンピューティングから…

3

メモリ

メモリ

メモリ

メモリ

SoC

SoC

SoC

SoC

…メモリ主導型コンピューティングへ

限られたメモリ容量

大量のデータ移動が発生

大容量のメモリ

データの移動ゼロ

メモリ主導型コンピューティングMemory Driven Computing (MDC)

4

現在のコンピュータ・アーキテクチャー

5

I/O

銅線

DRAM

プロセッサ

メモリ

ストレージ ネットワーク

DDR

PCIe

HDD / SSDFlash Memory

EthernetInfiniBand

メモリとストレージを統合

6

DRAM

銅線

プロセッサ(SoC)

メモリストレージ

ネットワーク

電源を切ってもデータが消えない高速なメモリを使用

7

銅線

プロセッサ(SoC)

ネットワーク

次世代不揮発性メモリ

インテル、DIMM型の「Optane DC」不揮発性メモリモジュールを発表

8

2018年5月

不揮発性メモリ(Persistent Memory) : メモリ、ストレージとの比較

9

比較項目 メモリ(DRAM) 不揮発性メモリ(Persistent Memory)

ストレージ(SSD)

容量 GB TB TB

データ保持のための電源 必要 不要 不要

アクセス形式 バイト単位 バイト単位 ブロック単位(4K)

消耗 なし なし あり

コスト $$$ $$ $

データ・アクセス速度の比較

10

1

10

100

1,000

10,000

100,000

1,000,000

10,000,000

SRAM DRAM Persistent Memory Flash / SSD HDD

Access Latency [nanoseconds]

SSD より約500倍高速!

デバイス間の接続を高速なインターコネクトで統一

11

プロセッサ(SoC)

ネットワーク

銅線 / 光ファイバー

次世代不揮発性メモリ

プロトコル

Gen-Z コア仕様 1.0 リリース!https://genzconsortium.org よりダウンロード可能

12

13

Consortium Members• 3M• Allion Labs• Alpha Data• AMD• Amphenol• ARM• Avery Design Systems• Broadcom• Cadence• Cavium• Cisco Systems• Cray• Dell EMC• ETRI• Everspin• FIT• Google• Hirose• HPE• Huawei

• IBM• IDT• IntelliProp• Jess Link• Keysight• Lenovo• Lotes• Luxshare-ICT• Mellanox• Micron• Microsemi• Mobiveil• Molex• NetApp• Nokia• Numascale• Oak Ridge Natl Labs• PLDA Group• Qualcomm• Red Hat

• Samsung• Seagate• Senko Advanced Comp• Simula Research Lab• SK hynix• Smart Modular• Spin Transfer Tech• TE• Teledyne Lecroy• Toshiba Memory Corp• Univ. New Hampshire• VMware• Western Digital• Xilinx• Yadro• Yonsei University

* ボードメンバー

2018年8月現在

新しいプロトコル Gen-Z がメモリの共有を可能に!

14

DRAM

プロセッサ メモリ

DDR

PMEM

Persistent Memory

DRAM

プロセッサ

メモリ

PMEM

Persistent Memory

プロセッサ

GPU や I/O も Gen-Z で接続

15

DRAM

プロセッサメモリ

PMEM

Persistent Memory

GPU

FPGA

Storage

Network

新しいユニバーサル・プロトコル Gen-Z

Gen-Z

DDR

PCIe

SAS / SATA

Ethernet

InfiniBand

メモリ

I/O

ストレージ

ネットワーク

インターコネクト

現代のコンピュータに混在する様々なプロトコルをすっきりとシンプルに

16

17

デザインコンセプト例: ユニバーサル・リソース・シェルフ

各モジュールはすべて で接続拡張用スイッチ(他のシェルフと Gen-Z で接続)

リソース・ドロワー

低消費電力モジュールメモリ(DRAM、SCM、フラッシュ)ストレージ(SSD)

高消費電力モジュールCPU、GPU、FPGA など

GPUASIC

Quantum

RIS

CV メモリ

プロセッサー中心のコンピューティングから…

18

メモリ

メモリ

メモリ

メモリ

SoC

SoC

SoC

SoC

…メモリ主導型コンピューティングへ

Real-time Enterprise

High performance Data analytics

SAP HANAin-memory

Project “Kraken”Co-innovation with SAP

Superdome X

Memory-Driven Computing

Superdome FlexExtreme scalabilityfor transactions & analytics

From in-memory to Memory-Driven Computing

インメモリからメモリ主導型コンピューティングへHPE が業界をリード

HPE Superdome Flexメモリ主導型コンピューティングに最も近いプラットフォーム

20

HPE Superdome Flex は HPE と SGI のいいところ取り

スケーラビリティブレード・アーキテクチャ2-16s CPU、最大 48TB の共有メモリ

IO メザニンカード最大24 毎とスイッチ類外部ドライブのみ

柔軟性nPARs, VMware, KVMエントリモデルでも高いコスト

可用性 DDDC + 1, LER, AER, セルフヒーリング, SGLX

ユーザー経験 OA, IRS, Proactive Care, OneView

HPE Superdome X

SGI UV300スケーラビリティ

モジュール・アーキテクチャ4-32s CPU、最大48TB の共有メモリ

IO PCIe カード最大 96 枚IO カード

柔軟性 エントリモデルの低いコスト, KVM

可用性 先進的な x86 RAS, MemLog

ユーザー体験 SGI インターフェイス, RMC

Superdome Flex比類なきスケーラビリティモジュラー・アーキテクチャ4s から 32s CPU、最大48TB メモリ

無限の IOPCIe カード(LP / FH)最大 128 枚の IO カード

さらなる柔軟性nPARs, VMware / KVM/ OVM低コスト 4s/8s

極限の可用性ADDDC + 1, LER AER, セルフヒーリング、Serviceguard for Linux

シンプルなユーザー体験OneView, IRS, Proactive CareOpenStack

21

証明された RAS99.999% のシングルシステム稼働率

比類なきスケーラビリティ最大 32 CPUソケット、48 TB メモリ

将来性を考慮した設計Persistent Memory や Gen-Z を将来サポート

メモリ主導型コンピューティングを念頭に設計

HPE Superdome Flex

22

モジュール型アーキテクチャ:将来の拡張を考慮した設計どんなサイズのビジネスにも簡単かつ経済的に対応可能

23

1つの基本ブロック・モジュール、1つのシステム、1つのアーキテクチャ

最小 最大

4 ソケット(最大6TBメモリ)

8 ソケット(最大12TBメモリ)

16ソケット(最大24TBメモリ)

32ソケット(最大48TBメモリ)

20ソケット(最大30TBメモリ)

4ソケット基本ブロックモジュール

Superdome Flex はシングルシステムとしてシームレスに拡張可能

非常に優れた I/O 能力

24

前面

背面

NVMe PCIe SSD6.4 TB

NVIDIA Tesla P100 GPUInfiniBand EDR 100Gb Omni-Path

NVIDIA Tesla V100 GPU

最大16枚 最大4枚最大16枚 最大16枚 最大16枚

PCIe カード・スロット

インメモリコンピューティング時代の宇宙論

「重力波に関する最近の発見により、ブラックホールと宇宙全体に関する驚くほど有益な情報がもたらされています。こうした胸が躍るような新しいデータを活用して常に先を行き、理論を検証してイノベーションを推進するに、柔軟性の高い強力なコンピューターシステムが必要なのです。」

ケンブリッジ大学 Department of Applied Mathematics and Theoretical Physics研究部長兼Centre for Theoretical Cosmology創設者、スティーヴン・ホーキング博士

数テラバイトリアルタイムの分析とシミュレーションを行うためにメモリ内に保持されている

宇宙に関するデータHPE Superdome Flexインメモリ・コンピューティング・プラットフォーム

メモリ主導型コンピューティング検証環境Memory Driven Computing (MDC) サンドボックス

26

インメモリ・コンピューティングからメモリ主導型コンピューティングへ

27

共有メモリ型 (スケールアップ)

SoC

SoC

Net

wor

k物理サーバー

Coh

eren

t In

terc

onne

ct

メモリ主導型コンピューティング

大容量メモリ

Net

wor

k

ローカルDRAM

ローカルDRAM

ローカルDRAM

ローカルDRAM

SoC

SoC

SoC

SoC

大容量メモリ

物理サーバー

Superdome Flex

メモリ主導型コンピューティングの検証環境を発表

• 初の商用製品を使ったメモリ主導型コンピューティングの検証環境• HPE Superdome Flex 上に The Machine ソフトウェアを実装• 現在、米国にてシステムを構築中• 稼働開始後はクラウド形式で全世界からアクセス

• メモリ主導型コンピューティング向けアプリケーションの早期開発や検証に利用

メモリ主導型コンピューティング・サンドボックスMemory-Driven Computing Sandbox

28

NUMAlink

Superdome Flex の隠し機能を使ってノード間のメモリ共有を実現

FAM

メモリノード

4s コンピュートノード

8sコンピュート

ノード

メモリノード メモリノード メモリノード

16sコンピュート

ノード

4s コンピュートノード

8sコンピュート

ノード

4s コンピュートノード

4s コンピュートノード

共有メモリ

コンピュート・ノード

64ソケット構成のSuperdome Flex

FAM

筐体内部を複数のノードに分割

メモリノード メモリノード

メモリノード メモリノード

4s コンピュートノード

4s コンピュートノード

4s コンピュートノード

4s コンピュートノード

8s コンピュートノード

8sコンピュート

ノード

16sコンピュート

ノード

各ノード間を NUMAlink を使ってアクセス可能に

• ノード構成は自由に組み替え可能• メモリはトータル最大 96 TB

~400 ns

29

メモリ主導型コンピューティングが神経変性疾患との闘いを支援

ドイツの研究所「DZNE」はHPEのメモリ主導型コンピューティングと出会い、アルツハイマー病の研究に新たな可能性をもたらす、これまでにないレベルの処理速度の向上を実現

60%の電力量カットによる研究費削減

101xの分析速度向上によって研究のボトルネックを解消

22分かかっていた処理が 13 秒に!

メモリ主導型コンピューティングをすべてのワークロードにユニバーサルなアーキテクチャ

低消費電力、大容量メモリ アプリケーション特有のタスク向けアクセラレータ

エッジでの機械学習

エッジ・デバイス クラウド・インフラ ビッグメモリ・マシン エクサスケール・スパコン

ハイパフォーマンスデータ分析

大規模なファブリック接続メモリ

モンテカルロシミュレーション、グラフ解析など

莫大な数のノードとファブリック上のメモリ

メッセージ通信とチェックポイントにファブリックを利用

コンポーザル・インフラストラクチャー(エッジ~クラウド)

コンテナ・アプライアンス

マイクロ秒で応答する大規模環境のマイクロサービス

まとめ

32

まとめ

–今年はメモリ主導型コンピューティングの主要テクノロジーに大きな進展あり

– 初の DIMM 型不揮発性メモリのサンプル出荷開始、来年市場に本格投入

– 次世代ユニバーサル・プロトコル Gen-Z の仕様 1.0 策定完了、現在公開中

– Gen-Z 参加メンバー増殖中、製品化に向けた開発も大詰めに

–メモリ主導型コンピューティングに最も近いサーバー HPE Superdome Flex リリース

– HPE と SGI のテクノロジーを融合

– 最大 48 TB の DRAM メモリをシングルシステムとしてサポート

– 次世代 Superdome Flex は Intel の Persistent Memory をサポートし、さらに大容量の「メモリ」を搭載可能に

–メモリ主導型コンピューティングの検証環境(サンドボックス)を発表

– Superdome Flex の隠し機能を利用、商用製品を使った初のメモリ共有システムを実現

– 現在、米国でシステムを構築中(年内にはリモート利用が可能になる予定)

– この検証システムの製品化も検討中

33

Thank you

34