35
Machine Learning on AWS 2017.04.29 Makoto Shimura, Data Science SA 1

Machine Learning on AWS

Embed Size (px)

Citation preview

Page 1: Machine Learning on AWS

Machine Learning on AWS

2017.04.29Makoto Shimura, Data Science SA

1

Page 2: Machine Learning on AWS

Amazon における機械学習の取り組み

2

Page 3: Machine Learning on AWS
Page 4: Machine Learning on AWS
Page 5: Machine Learning on AWS

AWS が提供する機械学習サービス

5

Page 6: Machine Learning on AWS

4 レイヤーから構成される AWS の機械学習サービス

6

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFlow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGrass FPGAMore toCome

In 2017HardwareP2

Page 7: Machine Learning on AWS

4 レイヤーから構成される AWS の機械学習サービス

7

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFlow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGrass FPGAMore toCome

In 2017HardwareP2

Page 8: Machine Learning on AWS

AI Services

8

文章をリアルな音声に変換するサービス

Polly Lex声やテキストを使用した会話型インターフェイスを様々なアプリケーションに構築する

ためのサービス

Rekognition画像分析機能をアプリケーションに簡単に追加できるようにするサ

ービス

※※これらは,これらは,fine-tuning fine-tuning されたされた AWS AWS が提が提供する深層学習モデルを供する深層学習モデルを API API で簡で簡単に利用できるマネージドサービスとなります単に利用できるマネージドサービスとなります

Page 9: Machine Learning on AWS

Polly• テキストを,リアルな音声に変換するサービス• 24 の言語で 47 のリアルな声優の音声を提供• 音声の保存と配信,SSML* と Lexicon** によるカスタマイズが可能• リップシンクのためのスピーチマーク機能や,ささやき声の発話機能が追加

9 * Speech Synthesis Markup Language ** 語彙目録

<lexeme><grapheme>Kaja</grapheme><grapheme>kaja</grapheme><grapheme>KAJA</grapheme><phoneme>"kaI.@</phoneme>

</lexeme>

My daughter’s name is Kaja.ねぇちょっとちょっと,ここだけの話だけどさ<speak> <prosody rate="x-fast"> ねえ,ちょっとちょっと, <amazon:effect name="whispered"> ここだけの話だけどさ </amazon:effect> </prosody></speak>

SSML Lexicon

4/19 機能追加

Page 10: Machine Learning on AWS

Polly - ユースケース

4. 音声データが S3 バケットに保存される

1. 新しい記事がRSSチャネルに出稿される 2.Lamda が記事のテキストを取得

し、音声変換するために Polly にデータを送信する

3.Polly はテキストを受信し、ラムダに

音声データを流し戻す

記事を音声に変換して MP3 でダウンロードする

13

Page 11: Machine Learning on AWS

Rekognition• 深層学習に基づく画像認識サービス• 以下の各種機能を API で提供し,アプリケーションに簡単に追加できる• イメージモデレーション機能が新たに追加,性的・暴力的な画像を検出

11

物体とシーンの検出 顔分析 顔照合 顔認識

4/19 機能追加

Page 12: Machine Learning on AWS

Rekognition - ユースケース

2.モバイルアプリが新しい画像をS3 にアップロードする

3.Lambda 関数がトリガされ、Rekognition を呼び出す

4.Rekognition は S3 から画像を取り出し、

識別された資産や設備に対してラベルを返却する

5.Lambda 関数はラベルとコンフィデンス値を Elasticsearch にも投入します

6. ユーザが資産を検索したり観たりすることができる

1. 業者が不動産物件の画像を撮る

Detectlabels API を使った不動産物件の検索

15

Page 13: Machine Learning on AWS

BookHotel

Lex• 音声やテキストを使用して,任意のアプリケーションに対話型

インターフェイス(ボット)を構築するサービス• AWS Lambda,Amazon Cognito や Amazon DynamoDB などと統合可能• GA に合わせて Slack, Twilio 統合や SDK サポートなどの機能追加

16

Intentsintent はユーザが入力した自然言語に応答してfulfillmentを実行する

Utterances

Slots

Fulfillment

intent を発動するフレーズ

intent を満たすために要求される入力データ

intent を実現するビジネスロジック

PromptSlot を引き出すためのフレーズ

4/19 GA

Page 14: Machine Learning on AWS

Lex - ユースケース

1.患者がケア施設に午後3時の予約を要求する

2.Lex は予約のスケジューリングが

リクエストされたことを認識する

3.Lex が予約について都合の良い

曜日を尋ねる

4.予約時間が確保される

5.患者は木曜日の午後3時に予約完了の通知を受ける

ユーザ入力情報

Lex のテキストレスポンス

患者向け診察予約ボットを構築する

17

Page 15: Machine Learning on AWS

4 レイヤーから構成される AWS の機械学習サービス

15

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFlow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGrass FPGAMore toCome

In 2017HardwareP2

Page 16: Machine Learning on AWS

Amazon machine Learning

• スケーラビリティ: システムの拡張や運用を考える必要がない

• パッケージ化:テストデータ分割や評価手法,予測 API の提供などが組み込まれている

16

Amazon Redshiftアプリケーション

Redshift上の取引データを使ってAmazon MLで不正取引の抽出を行い、S3に出力される結果をRedshiftに戻して利用。

2クラス分類 ロジスティック回帰

多クラス分類 多項ロジスティック回帰 回帰分析 線形回帰

Page 17: Machine Learning on AWS

Amazon EMR (Elastic MapReduce)

• フルマネージドな Hadoop を提供しており,クラスタの構築,構成変更,破棄まで管理可能

• HDFS ではなく S3 上のデータを直接読み書きすることで,コンピュートとストレージを分離可能

• ワークロードに応じたクラスタを複数立ち上げて,同一データを処理可能

• ETL 処理から機械学習まで幅広く利用可能

17

Page 18: Machine Learning on AWS

機械学習・分析処理のためのソフトウェアスタック

18 http://docs.aws.amazon.com//emr/latest/ReleaseGuide/emr-release-components.html

Page 19: Machine Learning on AWS

機械学習・分析処理のためのソフトウェアスタック

19 http://docs.aws.amazon.com//emr/latest/ReleaseGuide/emr-release-components.html

Page 20: Machine Learning on AWS

4 レイヤーから構成される AWS の機械学習サービス

20

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFlow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGrass FPGAMore toCome

In 2017HardwareP2

Page 21: Machine Learning on AWS

AWS は MXNet を全面的にサポート

• マルチ GPU でのスケーラビリティに優れている• AWS 社員もコミッターとして活躍• CloudFormation で MXNet クラスタを構築するテンプ

レートを提供

21 http://aws.typepad.com/sajp/2016/11/mxnet-default-framework-deep-learning-aws.html

Page 22: Machine Learning on AWS

Deep Learning AMI で各種パッケージを手軽に利用

22

OS はAmazon Linux と Ubuntu の2種類各種フレームワークがプリインストール*

• MXNet v0.9.3 tag• Tensorflow v1.0.1 tag• Theano rel-0.8.2 tag• Caffe rc5 tag• Caffe2 v0.6.0 tag• CNTK v2.0 beta 12.0 tag• Torch master branch• Keras 2.0.2 tag

https://aws.amazon.com/marketplace/pp/B01M0AXXQB?qid=1475211685369&sr=0-1&ref_=srh_res_product_title 

Page 23: Machine Learning on AWS

4 レイヤーから構成される AWS の機械学習サービス

23

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFlow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGrass FPGAMore toCome

In 2017HardwareP2

Page 24: Machine Learning on AWS

Deep Learningに最適なP2インスタンス

• 最新のGPUアクセラレータNVIDIA Tesla K80を最大16個搭載可能• 大量のGPUを使うことで,ディープラーニングのモデル構築にかかる時間を大

幅に短縮可能• AMI(Amazon Machine Image)を使うことで,ディープラーニングの学習環

境を容易に構築可能

24

InstanceName

GPUCount

Memory GPUMemory

NetworkPerformance

P2.xlarge 1 61GiB 12 GiB High

P2.8xlarge 8 488GiB 96 GiB 10 Gigabit

P2.16xlarge 16 732GiB 192 GiB 20 Gigabit

Page 25: Machine Learning on AWS

FPGA による高性能演算を実施可能なF1 インスタンス

4/19 GA

構成– Intel Xeon E5-2686v4 (2.3GHz, Turbo mode対応) – 1-8個のFPGA(Xilinx UltraScale+ VU9P)– 最大976GBのメモリ– 4TBのNVMe接続のSSDを利用可能

Page 26: Machine Learning on AWS

Xeon “Skylake” 搭載の C5 インスタンス

• Deep Learning に適した命令セット AVX512 を搭載– AVX-512 Vector Neural Network Instructions Word

variable precision (4VNNIW)– AVX-512 Fused Multiply Accumulation Packed Single

precision (4FMAPS)• Caffe2 は AVX512 の計算最適化に対応

26

2016/12 発表

https://software.intel.com/en-us/blogs/2017/04/18/intel-and-facebook-collaborate-to-boost-caffe2-performance-on-intel-cpu-s

Page 27: Machine Learning on AWS

EC2 クラスタ上の複数のコンテナを ECS で管理

• Dockerコンテナを複数のEC2インスタンスに分散配置できる• 一時的な計算処理にも、ロングランニングな処理にも対応• ELB連携など各種AWSサービスとの親和性• AWS Batch で並列実行も可能

27

Page 28: Machine Learning on AWS

事例

28

Page 29: Machine Learning on AWS

RoomClip における Rekognition + Amazon Machine Learning の事例

• 部屋のインテリア実例共有サイト• 「部屋全体を映している画像かどうか」を判定• マネージドサービスを組み合わせることで,低コストで機械

学習サービスを構築

29Amazon RekognitionとMachine Learningで画像判定機を気軽に作るhttp://engineer.roomclip.jp/entry/20

部屋画像のラベルを抽出

特定ラベルの確信度を独立変数として

部屋写真か否か判定するモデルを構築

構築したモデルでその他画像を判定

Rekognition AmazonMachine Learning

Page 30: Machine Learning on AWS

Motorola Solutions における画像認識の活用事例

• 警察官が利用できるデバイス, サービスを提供• 不明者の発見にAmazonの画像認識、音声認識を活用

AWS re:Invent 2016: Machine Learning State of the Union Mini Con (MAC206) – YouTubehttps://youtu.be/HqsUfyu0XJc?t=183329

• カメラでリアルタイムに顔を抽出して AWS に送信

• DBにデータを保存して Rekognition に顔認識顔リクエストを送信

• マッチしたら、イベントでPollyを呼び出して,音声でアラートを通知

Page 31: Machine Learning on AWS

Capital One における音声認識の活用事例

• 全米最大のネットバンク,4位のクレジットカード発行会社• Amazon Alexa を活用した音声ベースのバンキングアプリ• ユーザのアクセシビリティを改善する取り組み

31AWS re:Invent 2016: How Capital One Built a Voice-Based Banking Skill for Amazon Echo (ALX201) – YouTubehttps://www.youtube.com/watch?v=-MtwpZFmexg

Page 32: Machine Learning on AWS

Zillow における Spark MLlib のユースケース

• Zillow は住宅のマーケットプレイスに関するWebサービスを展開

• さまざまなレコメンデーションを活用– セール物件 / 貸出可能物件をメールで利用者にプッシュ– 「この物件に似た物件」– パーソナライズド検索– 住宅購入確率,物件売却

確率の予測– 類似画像 / 動画

32AWS re:Invent 2016: Zillow Group: Developing Classification and Recommendation Engines with Amazon EMR and Apache Spark (MAC303 )https://www.slideshare.net/AmazonWebServices/aws-reinvent-2016-zillow-group-developing-classification-and-recommendation-engines-with-amazon-emr-and-apache-spark-mac303

Page 33: Machine Learning on AWS

まとめ

33

Page 34: Machine Learning on AWS

まとめ

• Amazon では機械学習技術を活用した取り組みを実施• 4 つの形で機械学習技術を提供しており,ビジネスの状

況に合わせて活用可能– サービス– プラットフォーム– エンジン– ハードウェア

34

AI ServicesAmazon Rekognition

Amazon Polly

Amazon Lex

More to come in 2017

AI PlatformAmazon Machine Learning

Amazon Elastic MapReduce

Spark &SparkML

More to come in 2017

Apache MXNet AI EnginesTensorFl

ow Caffe Torch Theano CNTK Keras

EMR/Spark ECS Lambda GreenGr

ass FPGAMore toCome

In 2017HardwareP2

Page 35: Machine Learning on AWS

35