SC16 NVIDIA NEWS

Preview:

Citation preview

Green500 で Tesla P100 搭載システムが 1,2 位を独占

SC16でのGPU関連発表のまとめ – 第5版

NEWS

NVIDIA DGX-1 の 124 ノードクラスタである「DGX SATURNV」が、 LINPACK 性能 3.3

PFLOPS を記録し TOP500 の28位にランクイン。エネルギー効率を競う Green500 では9.46 GFLOPS/W で首位を獲得しました。DGX SATURNV は NVIDIA 社内に設置され、各ノードに Tesla P100 (NVLink 版) を8基搭載しています。ノード間は Mellanox の EDR InfiniBand で接続され、13ノードでTOP500 にランクイン可能、 38 ノードで 1 PFLOPS を超える性能を発揮します。https://www.top500.org/system/178928

Green500 で DGX SATURNV に次ぐ 2 位を獲得したのは、7.45 GFLOPS/W を記録した、スイス国立スーパーコンピューティングセンター (CSCS) の Piz Daint です。Cray XC50 で構築されたこのシステムも Tesla P100 を採用しており、 TOP500 では9.78 PFLOPS の性能で理研の京コンピュータに次ぐ 8 位に入っています。https://www.top500.org/system/177824

今回 TOP500 リストに入った Tesla P100 搭載システムは DGX SATURNV と Piz

Daint の 2 システムで、その 2 つが Green500 の 1,2 位を獲得したことになります。Green500 リストはこちら: https://www.top500.org/green500/list/2016/11/

日本版

Google は 2017 年の早い段階で、 Tesla K80 および P100 を搭載する GPU インスタンスを、 Google Compute Engine と Google Cloud

Machine Learning で利用可能にすると発表しました。http://bit.ly/gcpgpuj

また、 Microsoft は Tesla M60 および K80 を利用可能な Azure

「N シリーズ」 を、 12 月 1 日に正式リリースすることを発表しました。http://bit.ly/azuregpuga

弊社 CEO ジェンスン・ファンは、米国エネルギー省、国立がん研究所等と共に、がん研究を加速する “Cancer Moonshot” というイニシアティブを支援する声明を発表しました。これには研究の共通プラットフォームとなる “CANDLE” という AI フレームワークの構築が含まれています。「DGX SATURNV は Cancer Moonshot のためのロケットだ」とジェンスン・ファンは述べました。http://bit.ly/nvcancermoonshot

“Cancer Moonshot” を支援

NVIDIA と Microsoft は、 ディープラーニングフレームワーク “Microsoft

Cognitive Toolkit” (旧称: CNTK)が NVIDIA DGX-1 等のオンプレミス環境と、クラウドの Microsoft Azure 「Nシリーズ」インスタンスの双方において最適な状態で稼働するように協力することを発表しました。http://bit.ly/nvmsai

Microsoft と AI 領域での協業を発表

NVIDA と IBM は、エンタープライズ領域でのディープラーニング活用を推進するため、IBM の OpenPOWER アーキテクチャ向けディープラーニングツールキット “PowerAI” 開発での協業を発表しました。これにより、 POWER8 と 4 基の Tesla P100 が NVLink で相互に接続された Power System S822LC といった強力なサーバーによる GPU

ディープラーニングを促進します。 http://bit.ly/nvibmai

ディープラーニングで IBM と協業クラウド各社の GPU サービスが充実

“PGI Community Edition” が登場 – OpenACC の普及を加速

SHARE YOUR SCIENCE

東京工業大学青木先生 JAXA 宮島様

“Share Your Science” は、 GPU を活用されている研究者の方々にインタビューを行い、その内容をご紹介いただく活動です。NVIDIA ブース特設スタジオでの収録に、日本からは次の皆様のご協力をいただきました。厚くお礼申し上げます。

• 東京工業大学 青木先生• JAXA 宮島様• 理化学研究所 藤田様、東京大学 山口様

(次ページの「WACCPD 2016 BEST PAPER AWARD」もご参照ください)

収録内容は後日、下記の Web ページで公開されます。お楽しみに!https://news.developer.nvidia.com/tag/share-your-science/ 理化学研究所藤田様 東京大学山口様

TOP500 リストを見ても明らかなように、プロセッサの多様性が増しています。異なるアーキテクチャ間でソースコードの移植性を高められる OpenACC は今後より重要になっていくでしょう。この度、機能的には上位エディションと同等で、商用を含めて無料でご利用いただける、“PGI Community

Edition” をリリースしました。既にダウンロード可能となっています。http://www.pgroup.com/products/community.htm

NVIDIA ブース特設スタジオ

Facebook: https://www.facebook.com/NVIDIAGPUComputing/

GPU 関連ブース紹介ブース紹介にご協力くださいました皆様、誠にありがとうございました。Facebook の NVIDIAGPUComputing ページの他、こちらでも写真にて紹介させていただきます。紙幅の都合等ですべてを網羅できておりませんこと、ご容赦ください。

東京工業大学大阪大学 CMC

富士通

東北大学

日立製作所 JAXA

Microsoft

AIST

Rescale (IBM CLOUD) AWS (Algorithmia)

KEK

ExaScaler

Twitter: @NVIDIAAIJP / @NVIDIAJapan

XTREME DESIGNGoogle

理研・東工大の共同研究チームが SC'16 BEST PAPER AWARD を受賞!

理研 AICS プログラム構成モデル研究チームの丸山直也チームリーダーとモハメド・ワヒブ特別研究員、東京工業大学学術国際情報センターの青木尊之教授の共同研究チームが、投稿された 442 報の中から SC’16 Best Paper Award を受賞されました。おめでとうございます!テーマは適合格子細分化法 (AMR) の GPU による高速化を容易にするフレームワークです。

“Daino: A High-level AMR Framework on GPUs”https://www.computer.org/csdl/proceedings/sc/2016/8815/00/8815a621.pdf

授賞式の様子 (理研 AICS Web サイトより)AMR はシミュレーションに必要な時間やメモリを大幅に削減でき高速化に非常に有効ですが、大規模な GPU スパコンでの使用にはプログラミングが複雑になるといった課題がありました。Daino は LLVM を利用したコンパイラベースの高レベルフレームワークで、CUDA コードを直接記述することなく、 GPU クラスタで並列実行されるAMR プログラムを生成することが可能です。 NVIDIA K20x を搭載したTSUBAME 2.5 スーパーコンピュータにおける 1000 GPU 規模での実験で、Daino が生成したコードは強スケーリング、弱スケーリング双方のケースにおいて通常の手書きコードに匹敵する性能を示しました。

理研・東大の共同研究チームが WACCPD 2016 で BEST PAPER AWARD を受賞!

SC16 と併催された、ディレクティブによるアクセラレータプログラミングのワークショップであるWACCPD 2016 において、理化学研究所の藤田様、東京大学地震研究所の山口様、市村先生らによる論文が Best Paper Award を受賞されました。おめでとうございます!

“Acceleration of Element-by-Element Kernel in Unstructured Implicit Low-

order Finite-element Earthquake Simulation using OpenACC on Pascal GPUs”http://waccpd.org/wp-content/uploads/2016/04/SC16_WACCPD_fujita.pdf

本研究では、京コンピュータを利用して開発された、地震災害の全段階をカバーする包括的シミュレーション用の非構造格子有限要素解析ソルバを、 OpenACC により低い開発コストで GPU に対応させられることを示しました。1 ノードの NVIDIA DGX-1 におけるテストでは、8 ノードの京コンピューターと比較して約 20 倍高速であることが示されました。

藤田様、山口様、市村先生

この資料: https://doc.co/uDcniz

Recommended