エヌビディア GPU が加速するディープラーニング

エヌビディア合同会社プラットフォームビジネス本部部長林憲一

ゲーム自動車エンタープライズ HPC & クラウド

ビジュアルコンピューティングの世界的リーダー

ディープラーニング最も急速にマーケットが拡大しているセグメント

ディープラーニングのために GPU を活用している企業例

顔、場所、物体認識

音声認識および翻訳

自然言語処理

ビデオ検索および分析

インデキシングおよび検索

レコメンデーションエンジン

コンピュータビジョン

自動運転

応用分野

幅広いディープラーニングの応用例

「検索の50%は音声か画像になるだろう」

Andrew Ng, Baidu

「ディープラーニングのおかげで、わずか一年で音声認識の誤認識率が23%から8%に下がりました。

自動写真整理とインテリジェント写真検索によって、まさに探していたイメージを見つけることができます。

文脈を理解し、自然言語処理、言語翻訳によって、ユーザーに即座に返事ができるのです。」

スンダル・ピチャイグーグル上級副社長

Google now

Google I/O 2015 基調講演

ディープラーニングを加速する3つの要因

ビッグデータよりよいモデル強力な GPU アクセラレータ

パフォーマンスリーダー

2008 2009 2010 2011 2012 2013 2014

倍精度演算性能

NVIDIA GPU x86 CPU

WestmereSandy Bridge

Haswell

GFLOPS

2008 2009 2010 2011 2012 2013 2014

メモリバンド幅

NVIDIA GPU x86 CPU

WestmereSandy Bridge

Haswell

Ivy Bridge

TESLA K80ビッグデータ解析と科学技術計算のた

めの世界最速のアクセラレータ

Caffe Benchmark: AlexNet training throughput based on 20 iterations, CPU: E5-2697v2 @ 2.70GHz. 64GB System Memory, CentOS 6.2

最大性能アプリケーション毎に

ダイナミックに性能を最大化

メモリ倍増ビッグデータアプリに最適

オイル& ガス

ビッグデータ解析

HPC 可視化

K4012GB

2倍高速2.9 TF| 4,992 コア | 480 GB/s

ディープラーニング: Caffe

最高のスループットのためのデュアル

GPU アクセラレータ

GPU とソフトウェアの進化による性能向上

AlexNet [A. Krizhevsky et al.,2012]

18M23M

16 Core CPU GTX Titan Titan BlackcuDNN v1

Titan XcuDNN v2

Millions

Images

1日当りにトレーンングできる画像の数 (Caffe)

E5-2698 v3 @ 2.3GHz / 3.6GHz Turbo

GPU は CPU の17倍の性能

ディープラーニングの性能を倍増

DIGITS 2 cuDNN 3 CUDA 7.5

自動マルチ GPU スケーリングで2倍の学習スピードを実現

単一GPUで2倍の学習スピードを実現より大きなモデルのサポート

2倍のデータセットインストラクションレベルの

プロファイリング

DIGITS

ディープラーニング GPU

トレーニングシステム

GPU様々な GPU ハードウェア

GPUクラウド

GPU クラスタ

マルチ GPU

ユーザインターフェース

レイヤー可視化

DNN の構成

データ処理トレーニング進捗管理

TheanoTorch

CaffecuDNN, cuBLAS

クラスター、サーバー運用に最適

24時間365日連続運用でビジネスを加速

ゲーマー、開発者に最適

いつでも、どこでも開発

GeForce で開発、Tesla で運用

GeForce Tesla

クラスター運用での最高性能

堅牢性、信頼性

データセンターのために設計Tier1 OEMシステム

ストレステスト

NVIDIA GPUDirect RDMA

メモリエラー保護

高速な演算

エンタープライズレベルサポート

GPU モニタリングと管理

3 年保証Gaming Drivers

ゲーム

GeForce Tesla

データセンターワークロード

なぜ運用には Tesla か?

判断基準 GeForce Tesla

実効演算性能動作クロックが動的に変化し、

演算性能は状況により変動一定のクロックで安定した性能

メモリーエラー保護なし全てのメモリがECC保護

動的ページリタイアメント

クラスター運用を

サポートする機能なし

GPUDirect RDMA

Tesla Compute Cluster ドライバ

クラスターモニタリング

および管理なし

GPU モニタリング・管理用のNVML

サードパーティ管理ツール

なぜ運用には Tesla か?

Tesla は予測可能な性能と運用管理性を提供

2012 20142008 2010 2016

Tesla Fermi

Kepler

Maxwell

Pascal16 ビット演算3D メモリNVLink

GPU ロードマップPascal アーキテクチャで１ワット当りのSGEMM性能を2倍に

GPU最適化ライブラリ (cuDNN, cuBLAS)

DLフレームワーク (Caffe, Torch, Theano)

DIGITS

アプリケーション

ディープラーニングにベストなプラットフォームを開発

すべての研究者や開発者に対して魅力的なプラットフォーム

NVIDIA ディープラーニングプラットフォーム

エヌビディア GPU が加速するディープラーニング

Technology

いまからはじめる組み込みGPU実装 · 例: ベクタ信号の ... コンピュータービジョン・ディープラーニングのgpu実装 ①統合開発環matlab コンピュータービジョン・ディープラーニングのアルゴリズム開発環境として強力なmatlab

GPU Tutorial

最新の VOLTA アーキテクチャと NVIDIA GPU …...エヌビディア合同会社佐々木邦暢(@_ksasaki) 最新のVOLTA アーキテクチャと NVIDIA GPU CLOUD (NGC) 3

ScilabTec Gpu

ハンズオン#2: マルチ GPUを用いたディープラーニ …...山崎和博ディープラーニングのためのGPU講習会-九州大学スーパーコンピュータシステムITOによる実習-ハンズオン#2:

ディープラーニングの実践的な適用ワークフロー · 2 アジェンダディープラーニングとは？（おさらい）ディープラーニングの適用ワークフロー

GPU Computing

Gpu Programming

データサイエンス基礎講座 - b-event. · PDF fileディープラーニングの実装どのフレームワークも匼本的にはGPU （Graphics Processing Unit)

超スマート社会（Society 5.0）を牽引するAI AI...AIの重要技術であるディープラーニング（深層学習）には、強力なデータ処理能力が必要です。エヌビディア

HEROZ株式会社（4382 · 《エヌビディア合同会社エンタープライズ事業部事業部長のコメント》 NVIDIA Tesla V100 GPUはディープラーニングを中心とするAIの高速処理に最適な世界最先端のデータセ

IA ー NVIDIA PRIMERGY GPU 次世代インフラによる › static › upload › seminar.jp...ディープラーニング開発とシステム構築の連携～gpu搭載オンプレミスが必要な理由～

エヌビディアが加速するディープラーニング～進化するニューラルネットワークとその開発方法について～

データサイエンス基礎講座 - b-event.impress.co.jp · ディープラーニングの実装どのフレームワークも匼本的にはGPU （Graphics Processing Unit)匏⽤が

中国の最新 GPU ディープラーニング事例のご紹介

プラットフォームサービス Zinrai ディープラーニング ... FUJITSU Cloud Service K5 Zinrai プラットフォームサービス Zinrai ディープラーニング

GPUコンピューティング（CUDA) 講習会gpu-computing.gsic.titech.ac.jp/Japanese/Lecture/2009-09...2009/09/28 · GPUアセンブリ部をGPUアセンブリ（ptxas）によってGPU機械語へコンパ

FUJITSU AIソリューション Zinraiディープラーニングシステ …Graphics Processing Unit GPU Network Attached Storage NAS Zinrai ディープラーニングシステム

展示会開催のご案内 · 15：15～15：35 インダストリ分野でのAI、ディープラーニング実装を加速するJetson プラットフォーム講師：エヌビディア合同会社

データサイエンス基礎講座 - 株式会社インプレス...ディープラーニングの実装どのフレームワークも匼本的にはGPU （Graphics Processing Unit)匏