29
Smart SQM

Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

Smart SQM

Page 2: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

December 17, 2013

최종 사용자 관점의 웹서비스 성능 관리

실시간 전구간 성능 모니터링

최종 사용자 체감 성능 측정

성능 저하 원인 파악

Page 3: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

제안 배경

제품 개요

주요 기능

기대 효과

주요 납품 사례

2

3

4

5

주요 고객6

Contents

1

3

Page 4: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

전통적인 웹서비스 성능 관리 체계

각각의 고유 영역만을 관리하는 포인트 솔루션으로 웹 서비스 품질을 관리

1. 제안배경

4

APM, DB모니터링 영역

NMS네트워크 모니터링 영역

SMS시스템 모니터링 영역

가시성 저하 구간

처리시간

지연

무엇이 문제인가?

무엇이 문제인가?

인프라 중심의 성능 관리

사용자 서비스 불만 제기

처리 지연

처리 지연

가시성 저하 구간

가시성 저하 구간

가시성 저하 구간

품질 저하

Router Firewall Switch Application Database Web

Page 5: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

서비스 문제 파악의 어려움 불만이 지속되고 있지만 사용자가 직접 문제를 제기하기 전까지 알지 못함

서비스 품질 수준 관리 불가 시스템이 정상이면 최종 사용자의 성능도 좋을 것이라고 유추

신속한 장애 인지와 대응의 어려움 문제가 발생하고 있지만 성능 저하구간과 원인을 신속히 분석할 수없음

성능 개선을 위한 정량화된 지표 부족 투자시기 예측의 어려움 및 근거 데이터 부족

현재의 웹서비스 성능 관리 체계의 문제점

인터넷

최종 사용자

어플리케이션/데이터 베이스모니터링

네트워크, 보안 모니터링 시스템 모니터링

1. 제안배경

N/W, 보안: OK System: OK App & DB: OK

모든 인프라 자원은 철저히 관리되고 있지만 사용자가 실제 체감하고 있는 서비스 품질을 알 수 없다. 어느 구간에서 성능 저하가 발생하는지 알 수 없다.

불만 지속

5

Page 6: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

사용자 관점의 End-to-End 웹서비스 성능 관리의 필요성

최종 사용자의 성능이 서비스의 성능 기준이 되야 하며 사용자까지 관리 영역 확대 필요

어플리케이션 성능 관리

시스템 리소스 관리

네트워크 트래픽 관리

1. 제안배경

데이터 센터 - 인프라 중심의 성능 관리

End-to-End 모니터링 – 사용자 관점의 성능 관리

사용자가 체감하는 실제 서비스 속도 측정

사용자부터 인프라까지 연계된 End-to-End 모니터링

관리 영역 확장

사용자

성능 관리 취약 구간

성능 저하 구간 분석과 문제 해결

6

Page 7: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

SmartSQM은 실시간 패킷 분석을 통해 웹서비스 전구간의 성능을 관리하는 시스템으로 사용자의 체감 속도와 서비스 구간별 성능 저하 문제, 서비스 가용성에 대한 분석과 모니터링을 수행합니다.

제품 소개

2. 제품개요

Delay

SmartSQM

Packet

Packet MirroringReal end-user Server

7

문제가 발생하는 구간과 원인은?

사용자의 체감속도는?

서비스 가용성은?

Page 8: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

SmartSQM의 구성은 스위치의 포트 미러링 기능이나 TAP스위치를 이용하여 구성되며 기존서비스에 영향이 없습니다.

SmartSQM의 설치 구성

일반적인환경의구성

2. 제품개요

SmartSQM

Packet Mirroring MGMT

L3 switch

Packet Mirroring

MGMT

SmartSQM

Network #1 Network #2 Network #3 Network #4

다중네트워크환경의구성- Asymmetric 네트워크, mash구조의 네트워크 적용

총 4개의 수집포트

수집 분석 모니터링

패킷 수집/분석/모니터링 기능을 단일 시스템에 통합

8

Page 9: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

2. 제품개요

• 유연한 설치 구성

- Agentless 방식의 구성으로 기존 서비스에 영향이 없음- 유지보수가 쉬우며 관리가 매우 용이함- OS에 관계없는 설치 적용 가능

• 1초당 실시간 성능 모니터링- 서비스 상태를 1초당 실시간 모니터링- 최종 사용자 관점의 성능 분석

• L7기반 DDoS 탐지- Slowloris, RUDY, HTTP flooding등 L7기반의 공격 탐지 경고- 사용자 행위 분석을 통한 악의적인 행위 실시간 확인

Service

Quality

Managment

Insightful

Analysis

Real-time

Performance

Monitor• 강력한 커스터마이징- 120여 가지의 기초 데이터를 이용한 다양한 대시보드 제공- HTTP, HTTPS외 SAP, RTSP, SIP등 비디오, 보이스 프로토콜 지원 가능- 마이플랫폼 환경 커스터마이징 지원- APM 솔루션 통합 연동 지원 가능

실시간 사용자 행위 분석(UBA)을 통한 성능관리 및 웹 서버 보호 기술 특허 적용

주요 특장점

SmartSQM은 성능 모니터링과 장애 요소를 분석하기 위한 도구를 동시에 제공하여 관리자의 신속한문제 해결을 유도합니다.

• 다양한 성능 분석 도구 제공- 트랜잭션 실시간 추적- 대용량 데이터 분석을 통한 이벤트 시점의 회귀 분석

9

Page 10: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

10

사용자 체감 성능 측정

최종 사용자가 경험하고 있는 웹 페이지 로딩 시간을 측정합니다.

사용자 관점의 체감 성능 측정이란?

구성 컴포넌트

- 사용자가 특정 페이지를 요청시 한 화면의 모든 컴포넌트를 다운로드 받기까지 소요되는 모든 시간을 측정 분석

Delay

Loading………….

Loading complete.

index.jsp

그룹핑을 위한 자동화 트래킹 도구 자체 제공

메인 화면

- 서비스별/업무별 3단계 그룹핑

배송

주문

의류

자동차

악세사리

단위 업무/서비스별 컴포넌트 그룹화

Level1

Level2

Level3

서비스 카테고리 정의

하위 종속 컴포넌트

구성 컴포넌트

order.asp

사용자의 체감 속도 단위: 한 페이지

구성 컴포넌트

sale.html

jpg

gifcss

js

xml

swf

pngjsonjpg

gifcss

js

xml

swf

pngjsonjpg

gifcss

js

xml

swf

pngjson

Page 11: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

11

서비스 단위별 컴포넌트를 그룹핑하여 사용자의 실제 체감 성능 모니터링과 지연 원인을 분석 합니다.

단위 서비스별 사용자 체감 성능 분석

서비스별 사용자 체감 속도 모니터링

• 서비스별 최종 사용자 체감 속도 측정

• 단위 업무별 성능 저하 원인 분석

• 일별, 월별 체감 속도 지연 현황 및 추이 분석

사용자 체감 속도

지연 원인에 대한 추이

사용자 체감속도 추이

Page 12: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

12

직관적인 사용자 체감 속도 대시보드를 제공합니다.

사용자 체감 성능 관제 모니터링

단위 업무/서비스별 사용차 체감속도 대시보드 상황판

정상

경고

주의

설정된 임계치 내의 응답속도

설정된 임계치 속도를 초과하여 서비스된 경우

설정된 서버의 응답 대기 비율이 초과한 경우(서비스 지연이 심각한 경우)

실시간 응답대기 세션율

사용자 체감 속도 측정

체감 속도 추이 그래프

3단계 사용자 체감 위험 지수 경고

실시간 네트워크 사용량

사용자 체감속도와 실시간 서비스의 상태를 모니터링!!!

Page 13: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

13

사용자의 체감 속도 저하시 원인을 신속히 분석할 수 있는 기능을 제공합니다.

사용자 체감 성능 저하 원인 분석

단위 업무/서비스별 사용차 체감속도 대시보드

Click

문제파악

컴포넌트별지연원인분석

지연 원인: 네트워크

성능 저하 유발 컴포넌트

1

2

Click

Page 14: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

서비스 현황 실시간 모니터링

3. 주요기능

문제 발생시 모든 관리 영역(N/W, Server, APP, Security, User)의 관점에서 통합 모니터링이 가능하여운영상황에 대한 가시성이 대폭 향상 될 수 있습니다.

모든 영역에서 접근이 가능한 대시보드

네트워크운영

• 프로토콜별 사용량• 네트워크 트래픽 추이• 사용자 추이• Latency 추이 그래프• TPS, CPS, PPS, BPS,

Session, RTT

• 서버의 부하 상태• 데몬의 작동 상태• WEB서버의 응답시간• APP서버의 응답시간• 서버의 에러 코드• 서버별 세션, 사용자 수

• 국가, 지역, ISP, OS, Browser, Mobile 접속 분포

• 사용자의 네트워크 속도• ISP, Telecom별 접속 분포

네트워크 모니터링 서버 모니터링

사용자 현황 모니터링• L7 DDoS 공격 유해

트래픽 모니터링• 서비스 위협 행위 분석

보안-위협요소 모니터링

14

보안

서버

사용자

Page 15: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

엔드-투-엔드 통합 모니터링

• 서비스 문제 분석웹서버의 문제인지?어플리케이션 서버의 문제인지?

• 세션별 상태 성능 분석세션별 네트워크 구간 문제 확인

• URL 서비스별 성능 저하 모니터링가장 성능이 저하되는 서비스는?

사용자가 어떤 서버에 접속해 있고 제공받는 서비스 품질이 어떠한지, 사용자의 행위가 인프라에 어떠한 영향을 주고 있는지에 대한 성능 저하 요인을 모니터링 합니다.

• 사용자 행위 분석(네트워크 분석)특정 사용자가 서버에 부하를 주고 있는지?

End-to-End 통합 상세 모니터링

서버 모니터링

세션별 모니터링

네트워크 모니터링

15

URL별 모니터링

Page 16: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

End-to-End 응답 시간 모니터링

3. 주요기능

DBWASWEB

Client RTT Server RTT

Web(µ ) latency

App(µ ) latency

Download (Response) time

Request time

Dynamic Content

Static Content

어느 구간에 성능 문제가 발생하는지 각 구간에 대한 응답 속도를 측정하여 분석 할 수 있습니다.

End-to-End 구간 응답시간 측정

WAS와 DB구간의 성능

WEB서버 성능사용자 성능

내부 네트워크 성능외부 네트워크 성능

16

Page 17: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

17

SmarSQM

서비스 이상징후를 실시간 탐지하여 심각한 문제가 발생하기 전 신속히 대응할 수 있습니다.

서비스 이상 징후 실시간 탐지

대시보드를 통한 서비스 이상 징후 탐지

서비스 품질 저하 예측

유해 트래픽 유입시

성능 지연 추이 모니터링 응답 대기 및 데몬, OS 상태

Page 18: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

18

서비스 장애 Pin-Point 분석

업무 시간 지연 현상 발생

매일 동일 현상 반복

트래픽 점유 컨텐트 확인

1초 단위 분석

중국 사용자의 과도한 트래픽 점유전체 서비스 지연 발생

54Mbyte pdf 문서 반복 요청

이벤트 시점의 그래프를 클릭하여 1초 단위로 해당 시점의 서비스 상태를 분석합니다.

드릴다운 기법의 핀포인트 문제 해결

Click

외부 불법 사용자의 과도한 컨테트 요청에의한 트래픽 유발 및 내부 전체 서버 성능저하 발생

Drill-Down 상세 분석

- 세션 단위 상세 분석

- 서비스(서버) 추이 분석 - 정밀 Pin-Point 분석

해당 시점의 60초 구간

Page 19: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

19

서비스 추이 상관 분석

측정 요소 항목별 Layer방식의 비교 분석 기능을 제공합니다.

Layer 비교 상관 분석

- 10개 항목 이상의 측정 요소

Transaction

RTT

응답대기세션 수(Wait)

초당 사용자 수(UPS)

MRTG 추이 분석

SmartSQM 추이 분석

Page 20: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

20

사후 장애 분석

서비스 상태에 대한 분석된 데이터를 저장, 재현 하여 과거 시점의 성능 문제를 분석합니다.

장애 시점의 회귀 분석

- 타임 머신 회귀 분석을 통해 과거 이벤트 시점의 장애 상황을 정밀 분석합니다.

REC

서버의 부하, 리소스는? 사용자 접속 행위는? 어플리케이션 서비스 성능은? 지연 원인, 트랜잭션 결과는?

7 days ago

09:00 AM

이벤트 시점

04:00 AM

1 day ago

7x24시간 세션 레코딩을 통한 장애 시점 상태 재현

상호 연관성 분석 상호 연관성 분석상호 연관성 분석

Server User Application Transaction, Latency

Page 21: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

21

F/W IPS www

방화벽과 IPS 모두 있지만 외부로 부터 지속적인 공격이 의심되는 경우

정상 트래픽이지만 사용자의 악위적인 행위에 의해 발생되는서버 위협 트래픽 감지

SlowlorisRUDY

• Layer 7 기반의 유해요소 탐지 경고• Slow HTTP Post(RUDY)• HTTP Slowloris• HTTP Slow Read• HTTP CC Attack• HTTP GET Flooding• Fast Attack• Syn Flooding• SCAN

방화벽, IPS를 통과한 지능적인 L7기반의 위협 요소를 최종 단계에서 탐지하여 최적의 운영 환경을 유지할 수 있도록 탐지 기능을 제공합니다.

성능 저하 유발 유해 트래픽 탐지

위협 트래픽 실시간 탐지 및 경고

SmartSQM

사용자 행위 분석 기반

경고

Page 22: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

22

서비스의 성능, 각 컴포넌트별 가용성을 모니터링 하여 해당 서비스의 성능 수준을 확인할 수 있습니다.

서비스 가용성 분석

서비스 가용성 분석

www.nasol.co.kr/images/product/sads.giflds.nasol.co.kr/Subject/Default.aspxwww.nasol.co.kr/Basic/Content.asplms.nasol.co.kr/Subject/Content/Default.aspx..

서버 가용성 분석 개별 컴포넌트별 가용성 분석

특정 컴포넌트 성능 저하로 인한 시스템의 가용성 저하 파악 네트워크, 시스템 리소스 문제가 아닌 특정 어플리케이션의 성능 문제 확인

서비스 컴포넌트별가용성 분석

서비스 지연을 경험한비율

서버별 가용성 분석

서비스 성능 수준 분석

Page 23: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

3. 주요기능

23

비즈니스 전략에 반영할 수 있는 정량화된 성능 통계 분석 데이터를 제공합니다.

통계 및 분석 리포트

성능 통계 지표

- 다양한 성능 통계 그래프 및 데이터 제공

• 국가• 지역• URL• ISP• 사용자 IP• Mobile 디바이스• OS• 브라우저• 응답코드• 컨텐츠

• 14가지의 보고서 파일 포맷 지원(pdf, xls, hwp, html, txt, doc, jpg등)

• 데이터 Export기능

• 요소별 사용자 지정 리포트 생성

Page 24: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

4. 기대효과

• 성능 저하 문제로부터 신속한 해결책 제시• 부서간 원활한 의사소통 체계 수립• 고급 운영인력의 비효율적인 단순 반복업무 제거

• 사용자의 불만 최소화로 기업의 브랜드 이미지 상승• 고객 이탈 방지• 기업의 잠재적인 기회비용 상승

• 신속한 원인 파악을 통한 인적, 물적 자원 낭비 방지• 무분별한 투자 방지 및 유지보수 비용 절감• 빠른 ROI 회수

• 성능개선을 위한 근거 자료 확보 및 시스템 효율성 검증• IT 운영 자원의 최적화 및 향후 투자 계획 수립• SLAs를 위한 객관적인 데이터 확보

24

IT 운영 효율성 향상

성능 지표 수립

비즈니스 경쟁력 향상

비용 절감

Page 25: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

5. 주요납품사례

스마트TV를 이용하여 다양한 컨텐트를(인터넷, VOD, 펌웨어 업데이트 등) 사용하는 최종 사용자의 실제 체감 성능파악과 성능이 저하시 문제의 원인을 파악하기 위해 도입

관계사에 제공하는 인프라 서비스의 서비스 성능 관리 방안 부재

사용자별 성능을 실시간 모니터링 하고 지연 원인을 분석, 개선하여 고객 서비스 품질 혁신에 기여하고 있음

복잡한 웹 서비스 구간의 성능 관리를 단일화 함으로써 각관리영역에서 발생되는 성능 문제에 대해 신속하게 대응하고 있음

시스템 구성도

기대 효과

추진 배경 및 필요성

Switch

패킷 미러링

Collector Port

MGMT

SmartSQM모니터링

25

Page 26: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

5. 주요납품사례

SMS, NMS, ESM 관제툴이 도입되어 운영중 WAS 모니터링, DB 모니터링 솔루션이 도입되어 있음. 외산 C사의 성능 모니터링 솔루션이 도입되어 있음

추진 배경 및 필요성

정보서비스 인프라 중심에서 다양한 분야로 관제포인트 확대

다양한 장애에 대한 원인파악에 장시간 소요

원활한 시스템 운영을 통해 서비스의 품질에 대한 신뢰도 확보

사후 정밀 분석을 통한 IT인프라 구축에 활용 사용자관점의 응답시간 모니터링으로 고객 만족도 향상

Switch

패킷 미러링

Collector Port

MGMT

SmartSQM

저장관리

SmartSQM

수집/분석

모니터링

시스템 구성도

기대 효과

26

현재 상황

Page 27: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

5. 주요납품사례

현재 상황

SMS, NMS, APM 운영중 서비스 성능 통계를 웹로그 분석기로 관리하고 있음 서비스 상황에 대한 신속한 분석과 현황파악에 어려움이 있

추진 배경 및 필요성

서비스 접속 현황에 대한 성능 통계 데이터 분석 방안 부재 서버 증설시 통계 로그 서버를 추가 증설해야 하는 상황으로

불필요한 예산 낭비 발생

도입 효과

SmartSQM 한대로 다수의 웹서비스 접속 통계를 분석

제한된 운영 인력의 업무 효율성을 향상시킴

향후 불필요한 투자 방지 및 예산 절감에 기여함

Switch

패킷 미러링

Collector Port

MGMT

SmartSQM모니터링

시스템 구성도

27

Page 28: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

6. 주요고객

28

Page 29: Smart SQM - siidc.com file시스템모니터링영역 가시성저하 ... - http, https외sap, rtsp, sip등비디오, 보이스프로토콜지원가능 - 마이플랫폼환경커스터마이징지원

감사합니다.