クラウドネイティブなアーキテクチャでサクサク解析

@imai_factory

第 27 回データマイニング +WEB ＠東京　 ( #TokyoWebmining 27th)

自己紹介• 名前

–今井雄太 ( @imai_factory )

• 仕事–ソリューションアーキテクトという仕事をしていて、主にアド、デジタルマーケティング、スタートアップのお客様のアーキテクティングのお手伝いをしています。

今日のアジェンダ• Amazon流の AWSの使い方

• クラウドネイティブなアーキテクチャとは？

• AWS上でデータ解析を行うために理解しておくべきコンセプト

Amazon 流AWS の使い方

Werner Vogels

CTO of Amazon.com

平均 11.6秒ごとにデプロイ1時間で最大 1,079回のデプロイ

1回で平均 1万台のホストへデプロイ最大で 3万台のホストへ同時にデプロイ

LBを介して複数の AZに配置されたEC2へトラフィックを分散

新しいバージョンのコードをデプロイしたクラスタを新たに構築

テストして問題なければLBを新しいクラスタに振り向ける

問題が発生したら元のクラスタにトラフィックを戻す

環境をコピーしてABテストなども容易に実施可能

デプロイのスピードが早くて、リスクも少ないと

フィードバックループをより多く回せる

Amazon は自分たちのアーキテクチャをクラウドに最適化することにより、ビジネスを加速させている。

クラウドネイティブなアーキテクチャ

Controllable - 柔軟なコントロールResilient - 高い耐障害性

Adaptive - 状況の変化への追従性Data Driven - フィードバックループを回す

Controllable柔軟なコントロール

柔軟なコントロール

•システムを小さなコンポーネントにわけて疎結合に

•常にコストを意識したアーキテクチャを

コントロールしにくいアーキテクチャ• Webサーバーが CPUを食う？• DBがメモリを食う？• 画像がトラフィックを食う？• バッチが夜間に CPUを食う？

EC2インスタンス

本番環境

Amazon Route 53

特性の違うアプリが同一リソース上で動いているので扱いにくい

コントロールしやすいアーキテクチャ？

Amazon Route 53

LB1 LB2

API1 API2

DB1 DB2AW

アプリケーションごとにリソースを分ける

USD0/hr

USD17/hr

USD35/hr

USD52/hr

5AM 12PM 7PM 2AM

USD0/hr

USD17/hr

USD35/hr

USD52/hr

5AM 12PM 7PM 2AM

リザーブドオンデマンドスポット

事例： Pinterest

5AM 12PM 7PM 2AM

Provisioned Busy

AWS利用リザーブド & スポット

システムが密結合しているとこんなに頻繁に構成変更はできない。

リソースが一定だと、如何に稼働率を上げるかが重要になり、 1サーバーにいろんな役割を持たせがち。結果、密結合なシステムができあがる。

オンプレミス

usecase

コンポーネントを小さくわけると・・

• 各コンポーネントごとに適切なスケーリングが可能なので無駄が出にくい

• スケールするときに他のコンポーネントとの兼ね合いを気にする必要がないので要求に迅速に対応できる

Resilient高い耐障害性

高い耐障害性

•障害を例外として捉えない

•障害が起こる前提でシステムを考える

事例： S3(Simple Storage Service)

APIINDEX STORAGE

機能ごとにコンポーネント化し、それぞれに冗長性をもたせる。これによりホスト単位の障害でシステ

ムは止まらなくなる。

更に Availability Zone単位で構成を冗長化。AZが落ちてもシステムは止まらない。

usecase

NetFlixにはいたずらな猿たちが・・

usecase

Chaos MonkeyLatency Monkey

Conformity MonkeyDoctor MonkeyJanitor Monkey

Security Monkey

Chaos Gorilla

Adaptive状況変化への追従性

状況変化への追従性

•何も仮定しない

•キャパシティプランニングは後から精緻にすればよい

2サーバの数

4/12/2008

Facebook上での公開

トラフィックの急増にも対応( ピーク時は5000サーバー )

4/14/2008 4/16/2008 4/18/2008 4/20/2008

ソーシャルアプリは爆発力を秘めている

usecase

AWSなら

• スモールスタートはもちろん

• ラージスタートもできる

Data Drivenフィードバックループを回

フィードバックループを回す

•すべての事象をロギングする

•データはリアルタイム性が高いほど価値が高くなる

•フィードバックループは小さく

Controllable - 柔軟なコントロールResilient - 高い耐障害性

Adaptive - 状況の変化への追従性Data Driven - フィードバックループを回す

AWS上でデータ解析を行うために

理解しておくべきコンセプト

AWSで解析や計算を行う際にメリットを最大限にレバレッジするための３つのコンセプト

1. Data First2. AWS is software3. Workflow driven

Concept1:Data First

S3: Simple Storage Service

• AWSの最初のサービスのひとつ。（もうひとつは SQS)

• データの堅牢性が高く、格納容量に制限がないのが大きな特徴。

• 様々な他の AWSサービスからも利用されている。Storage

S3 as a origin data store

Amazon RDS

SnapshotAmazon EBS

Amazon EC2

DynamoDBAmazon EMR Amazon Redshift

backupt

CloudFrontContents

S3 上のデータ以外はステートレスにできる

Amazon RDS

SnapshotAmazon EBS

Amazon EC2

DynamoDBAmazon EMR Amazon Redshift

backupt

CloudFrontContents

Glacier RDS

RedShift

DynamoDB

Data Pipeline

WebApp

Dashboard

データ解析まわりのエコシステム

クラウドネイティブなアーキテクチャでサクサク解析

Technology

情報システム統合の目標－ビジネス・アーキテクチャ－ · 4．製造業のビジネス・アーキテクチャ製造業の異質なビジネス・アーキテクチャ

UltraScale アーキテクチャクロッキングリソース - Xilinx...UltraScale アーキテクチャクロッキングリソース 2 UG572 (v1.10) 2020 年 8 月 28 日 japan.xilinx.com

IA-32 インテルアーキテクチャデベロッパーズマ … インテル ® アーキテクチャソフトウェア・デベロッパーズ・マニュアル中巻A：

クラウドネイティブの先にある未来 · 2020-06-06 · クラウドネイティブはdxを加速するクラウドネイティブはビジネスにフォーカスし、システ

UltraScale アーキテクチャ Sele tIO リソースユー …...UltraScale アーキテクチャ SelectIO リソースユーザーガイド UG571 (v1.12) 2019 年 8 月 28 日

通信・データ処理アーキテクチャスペースリンクプロトコル …JERG-2-400-TP103 通信・データ処理アーキテクチャスペースリンクプロトコル

Goji とレイヤ化アーキテクチャ

Web2.0 サービスのアーキテクチャと実装

アーキテクチャスマニュアル Versal ACAP SelectIO リソー ......Versal ACAP SelectIO リソースアーキテクチャマニュアル AM010 (v1.1) 2020 年 11 月

UltraScale アーキテクチャコンフィギャラブルロ …...UltraScale アーキテクチャコンフィギャラブルロジックブロックユーザーガイド

クラウドネイティブに必要となるセキュリティとは · クラウドネイティブに必要となるセキュリティとは～マルチクラウド、ハイブリッドクラウドに無理なくセキュリティを導入可能にするPrisma

PostgreSQLアーキテクチャ入門（PostgreSQL Conference 2012）

VLSIアーキテクチャ（1）sakai/vlsi/vlsi1.pdfVLSIアーキテクチャ VLSIアーキテクチャ入門内容 –VLSIとはなにか –VLSIアーキテクチャの要件 •機能

クラウドネイティブにセキュリティを活用する！ …クラウドネイティブにセキュリティを活用する！ API を連携して実装する方法トレンドマイクロ株式会社

インテリジェントホームオートメーションシステムアーキテクチャ設計書 · インテリジェントホームオートメーションシステムアーキテクチャ設計書

UltraScale アーキテクチャ GTY トഊランシーバー …...UltraScale アーキテクチャ GTY トランシーバーユーザーガイド UG578 (v1.3) 2017 年 9 月 20

オペレーティングシステム i386 アーキテクチャ (2)

ICHIGAN 参照アーキテクチャ

12. ベクトル処理アーキテクチャ

Oracle WebLogic Server アーキテクチャ