35
Copyright (c) 2017 Lawson, Inc. All rights reserved. 1 クラウド時代の運用・監視 ~ システムを「視て」 ビジネスを「知る」 ~ 株式会社ローソン 業務システム統括本部 / システム基盤部 / マネジャー 進藤 広輔

クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 1

クラウド時代の運用・監視~ システムを「視て」 ビジネスを「知る」 ~

株式会社ローソン

業務システム統括本部 / システム基盤部 / マネジャー

進藤 広輔

Page 2: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 2

Agenda

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

AWSで残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 3: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 3

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

AWSで残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 4: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 4

1.会社紹介

▼1975年6月14日

約2兆円チェーン全店売上高

約22万人従業員 約13,000店店舗数

約1,000万人来店客数

(年間 約36億人)

成城石井

HMVユナイテッドシネマ

ローソンストア100ナチュラルローソン

ローソン1号店大阪 豊中にオープン

▼2017年5月31日42年

Page 5: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 5

1.会社紹介

進藤広輔 「シンドウ コウスケ」

➢ 所属 業務システム統括本部システム基盤部

➢ 職位 マネジャー

➢ 専門 ネットワーク&セキュリティ(プリセールスとPM)

【担当業務】

➢ AWS関連プロジェクトの統括と推進

➢ AWS関連システムの運営とカイゼン

➢ 社内へのAWS関連の営業活動と18名からなるチーム運営

Page 6: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 6

1.会社紹介

2015年ローソンがAWSを使うまでの軌跡

~打ち破れ現行踏襲~

2016年ローソンが考えるクラウド時代

に求められる新たなITパートナー像

2014年基調講演

AWS Summitとの歩み

Page 7: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 7

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

AWSで残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 8: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 8

2.ローソンとAWSの歴史

2.1 AWSとローソンの歩み

2013

2014

2015

2016

2017

2013AWS利用検討開始

2014店舗実験システムAWSガイドライン作成開始

2015発注セミオートシステムリリースAWSガイドライン0.5版

2016次世代店舗システム検討AWSガイドライン1.0版

2017次世代店舗システム構築開始

1

4

14

18

25

Page 9: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 9

2.ローソンとAWSの歴史

2.2 AWSに対するアプローチの変化

「AWS」って何? どう使うの?

「AWS」に乗せよう! AWS最適化!

2013 2014

2015 2016

2014

2017

Page 10: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 10

2.ローソンとAWSの歴史

2.3 なんでもAWSからの卒業

何でもAWS AWS or オンプレ 最適プラットフォーム

店舗システム

本部システム

EC

実証実験

新規

既存(マイグレ)

or

業務的SLA

性能諸元

処理特性

2013 2014 20172015 2016

Page 11: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 11

2.ローソンとAWSの歴史

2.4 進化し続けるAWSへの対応

2014年 2016年

Page 12: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 12

2.ローソンとAWSの歴史

2.5 役割(対応)の変化

~2016年 2017年~

オーダーメードによる『従来型SI』要件定義⇒設計⇒構築⇒テスト

メニュー形式の『サービス提供』ヒアリング⇒パッケージ選定

セキュア①セキュア②店舗①店舗②本部EC①EC②

Page 13: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 13

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 14: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 14

3.残り続けた現行踏襲

3.1 従来の監視・保守・運用とは

ハードウェアレベルで起きたことに気付き

起きた後の対処をすることが基本

・ ・ ・ ・ ・

・ ・ ・ ・ ・

閾値超過インシデント発生

Page 15: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 15

3.残り続けた現行踏襲

3.2 ローソンの監視・保守・運用の仕組み

LAWSONDC

監視中継サーバ

監視対象サーバ

監視Agent

監視対象AWSサービス

統合監視Monitor

統合監視サーバ

統合監視Manager

AWS共通基盤 業務システム

監視Aggregator

LAWSONAWS SQS

CloudWatch SNS

Redshift ELB Autoscaling

・・・

アプリ/インフラ保守担当者

ローソン維持管理チーム

Page 16: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 16

3.残り続けた現行踏襲

3.3 ローソンの監視・保守・運用の課題

自分のサーバは正常に稼働しているんだけど・・・

ユーザの「遅い」「重い」「繋がらない」に気付けない

外部システムの正常・異常を能動的に把握出来ない

結局はユーザからの問合せがトリガーになる

Page 17: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 17

3.残り続けた現行踏襲

3.4 従来の監視・保守・運用とAWSのギャップ

“従来” AWS

ハードウェアレベルのインフラ監視

従量課金

オートスケール

マネージドサービス

止まる・落ちる前提

起きたことへの対処

Page 18: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 18

3.残り続けた現行踏襲

3.5 AWSの監視・保守・運用で感じていた違和感

EC2を10台で構成しているWebサーバの1台でリブート発生!

RDSでリスタート発生!原因はAWSのストレージ機構・・・

業務は何の問題もなく継続出来ている・・・

特に対処は出来ない・・・

Page 19: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 19

3.6 ローソンの“チェンジ”と残り続けた現行踏襲

3.残り続けた現行踏襲

マインド

設計

関係性

• 作る⇒使う• 止まる前提• サイジングより起動

• AWS的“当たり前”

• 基盤と開発が合同• 情シスが主役

監視

保守

運用設計

運用

Page 20: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 20

3.残り続けた現行踏襲

3.7 監視・保守・運用の“チェンジ”

・・・・・

自動で増えたり、減ったりするEC2

自動で切り替わるRDS

止まる・落ちる前提で設計するAWS

従来通りの監視・運用・保守

Page 21: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 21

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

AWSで残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 22: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 22

4.クラウド時代の監視・運用

4.1 ローソンの答え

“ビジネス”を監視し運用する

AWSの特性を理解し受け止める

単体ではなく“全体”を見る

サービスの“利用者の体感”を知る

自動復旧・マネージド

業務・サービス

レスポンス・重い・軽い

Page 23: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 23

4.クラウド時代の監視・運用

4.2 ビジネス監視とは?

ビジネスに支障があるか・ないか

サービスの利用者の体感はどうか

③ユーザエクスペリエンスを視る

①システム全体・システム間の健全性を視る

ビジネスが何%以上正常に継続的に動いているか

② ビジネスの継続性・正常性を視る

Page 24: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 24

4.3 ビジネス監視の対象と項目

4.クラウド時代の監視・運用

システム全体

論理サーバ

機能

画面

トランザクション

リクエスト数

エラー数

平均応答時間

最大応答時間

遅延応答時間

遅延リクエスト数

監視対象 監視項目

Page 25: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 25

4.クラウド時代の監視・運用

4.3 ビジネス監視 システム構成図

Web/AP Batch R-Proxy

AppDynamics

Agent

Web/AP Batch

AppDynamics

Agent

コントローラサーバ

EUM

サーバ

業務システムA 業務システムB

AP共通基盤

店舗WAN

大崎本社 監視センター

ローソンDC

Page 26: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 26

4.クラウド時代の監視・運用

4.4 ビジネス監視 アーキテクチャ

Web/AP Batch R-Proxy

AppDynamics

Agent

Web/AP Batch

AppDynamics

Agent

コントローラサーバ

EUM

サーバ

業務システムA 業務システムB

AP共通基盤

店舗WAN

大崎本社 監視センター

ローソンDC性能情報送信

性能情報送信

性能情報参照

ブラウザ性能情報参照

Page 27: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 27

4.クラウド時代の監視・運用(参考)

①.システム全体の稼働状況確認

②.機能ごとの稼働状況確認

③.遅延が発生した状況を確認

④.処理のボトルネック解析

この画面ではシステムの構造と稼働状況(リクエスト数や性能値)が自動且つリアルタイムで可視化されている。この画面で稼働後の稼働状況チェックを行う

重大問題は赤でアラートされる

やや遅延は橙色でアラートされる

Page 28: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 28

4.クラウド時代の監視・運用(参考)

この画面では画面/バッチごとの利用状況(実行数/平均処理時間)、指定ルールで自動判別された性能状況が表示される。この画面で性能問題調査を行う

①.システム全体の稼働状況確認

②.機能ごとの稼働状況確認

③.遅延が発生した状況を確認

④.処理のボトルネック解析

画面/バッチ名実行数

/平均処理時間エラー/性能状況

機能ごとの遅延状況がパーセンタイルで可視化される

Page 29: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 29

4.クラウド時代の監視・運用(参考)

この画面では前画面で問題が発生している機能を特定し、どの実行に問題があったのかを識別する

①.システム全体の稼働状況確認

②.機能ごとの稼働状況確認

③.遅延が発生した状況を確認

④.処理のボトルネック解析

問題があると識別された箇所

Page 30: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 30

4.クラウド時代の監視・運用(参考)

この画面では性能を満たせないトランザクションをクラス単位にブレークダウンし、遅延の原因を特定する

①.システム全体の稼働状況確認

②.機能ごとの稼働状況確認

③.遅延が発生した状況を確認

④.処理のボトルネック解析

アプリケーションの処理を解析しJavaのクラス毎に処理時間を表示

発行SQLを特定して表示

Page 31: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 31

4.クラウド時代の監視・運用

4.5 ビジネス監視は何をもたらすのか?

設計~運用までをシステム部主導で推進出来る

システム部が直接ユーザの声を知ることが出来る

考え・取り組みがクラウドネイティブ

となる

リーダシップ ユーザ起点 クラウド深化

Page 32: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 32

1皆様に支えられています!

会社紹介

2日々これAWSなり!

AWSとローソンの歴史

3AWSの検討・利用が1段落してみて・・・

AWSで残り続けた「現行踏襲」

4脱システム監視。そしてビジネス監視へ

クラウド時代の監視・運用

5本日のまとめ

今後のAWSとローソン

Page 33: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 33

5.1 真のクラウドファーストへ向けて

AWS次第?

監視・保守・運用をAWSに最適化する

設計をAWSに最適化する

マインドをチェンジする

AWSを理解する

5.今後のAWSとローソン

AWSに出会う2013

2014

2015

2016

2017

2018

監視・保守・運用をAWSに最適化する

Page 34: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 34

5.今後のAWSとローソン

5.2 AWSへの期待とローソンの今後

Cloud で次世代システムを推進

インフラを抽象化し

ビジネスと業務の本質に注力

Page 35: クラウド時代の運用・監視2013 AWS利用検討開始 2014 店舗実験システム AWSガイドライン作成開始 2015 発注セミオートシステムリリース AWSガイドライン0.5版

Copyright (c) 2017 Lawson, Inc. All rights reserved. 35

ご清聴ありがとうございました。