30

[찾아가는세미나] 고객맞춤형 재해복구서비스

  • Upload
    -

  • View
    439

  • Download
    0

Embed Size (px)

Citation preview

Page 1: [찾아가는세미나] 고객맞춤형 재해복구서비스
Page 2: [찾아가는세미나] 고객맞춤형 재해복구서비스

목차

I. 최근의 사건 사고

II. 재해복구 트렌드 및 관련법안

III. DR의 필요성

IV. 맞춤형 IBM 솔루션 소개

V. 재해복구 성공 사례

VI. 한국 IBM 리질리언시 서비스

Page 3: [찾아가는세미나] 고객맞춤형 재해복구서비스

Ⅰ.최근의 사건 사고 (1/2)

3

전산서버가 있는 건물 변압기 화재로 인해교육청 주요 전산 시스템 가동이 중단되었고,전국 1만 여개 초·중·고·특수학교, 178개지역교육청, 17개 시·도교육청과 교육부를총망라한 교육행정정보시스템(NEIS)등이 한때가동을 멈췄습니다.

이러한 전산시스템 장애는 DR만 제대로갖춰졌더라도 큰 문제없이 넘어갈 수 있었음.

당초 교육부는 예산을 이유로 DR센터 구축에엄두를 못 내고 있는 상황이었습니다.

국제 보험업협회인 런던 로이즈(Lloyd’s of

London)와

영국 케임브리지대의 위기연구센터(Center for

Risk Studies)는 최근 전 세계 301개 도시의 향후

10년간 재난과 자연재해로 예상 피해액 규모를

공동으로 산정해 발표하였습니다.

서울은 타이페이와 도쿄에 이어 향후 10년간

관련 피해액 규모가 전 세계에서 세 번째로

컸습니다.

서울은 앞으로 10년 동안 사고와 자연재해로

인한 경제적손실 규모를 1035억 달러로 예상되며,

이러한 피해를 대비해 사전 재해복구 시스템

도입을 통한 준비가 필요합니다.

2015년 11월 서울시 교육청에 화재 발생교육행정정보시스템의 일부 운영 중단

서울, 세계에서 세번째로 재난에 취약

Page 4: [찾아가는세미나] 고객맞춤형 재해복구서비스

4

대구의 한 대형병원이 갑작스러운 전산시스템마비로 진 등록 및 입퇴원 수속, 처방전 발급 등의업무가 전면 중단되는 사태가 발생했다. 전산시스템의 갑작스런 마비로 진료 등록 및입퇴원 수속, 처방전 발급 등의 업무가 전면 중단. 병원 관계자는 “서버가 다운된 지 2시간 20분만인 오전 10시 50분쯤 복구를 마쳤다”고 말했다

의료기관에서 다루는 정보의 양과 질은 금융사에못지 않아, 재해 및 재난시에 더 위험하다. 하지만비용 이슈로 인해 많은 투자를 하고 있지 않았다.

2015년 7월 미국 증권거래소 및 항공사 시스템 장애 발생2015년 9월 국내 대형 병원 전산 시스템 장애 발생

미국 뉴욕증권거래소컴퓨터시스템에 이상이생겨 거래가 4시간가까이 중단. 거래주문은 모두 무효가됐고, 시장은 혼란에빠졌다.

비슷한 시간유나이티드항공시스템에서도 이상이발견돼 4900편의항공편 운항이 지장을받음.“사고는 처음이 아니고마지막도 아닐 것이다. 모두가 컴퓨터에의존하고 있고, 컴퓨터는 고장이 난다”

Ⅰ.최근의 사건 사고 (2/2)

Page 5: [찾아가는세미나] 고객맞춤형 재해복구서비스

DR 시스템을 구축한 기업 중 46.2%는 2시간 이내의 RTO/RPO를 정의하고 있으며 보다 빠른 RTO/RPO를

목표로 변화하고 있습니다.

F

RTO

RPO

범례 H

DI

G E

실시간복구

2시간이내

24시간이내

3일이내

정의안됨

실시간1시간이내

2시간이내

5시간이내

24시간이내

48시간이내

1주일이내

정의안됨

D D

I F

H H H

F F E

I

I I I

II F

D

D

F F

H D

F F

F F

D D I

G

F F

G I

I I I

G

G

F

I I

I I I

F F G

E

I

H

I I

D E

I I

IND DIST FIN

HOS GOV EDU

(n=64; DR 도입 기업)

2시간 이내 그룹

5

DR시스템 구축 기업들은 빠른 RTO/RPO 선호

DR 구축 기업의 46.2%가 2시간 이내의

RTO/RPO 정의

고객서비스가 중요하고 전산시스템에 대한

의존도가 높은 금융고객의 경우 대부분

상급기관에서규정된 3시간 이내 RTO를 준수

반면 IND는 시스템 중단이 되더라도 수기

등을 통해 업무는 지속할 수 있는 경우가

적지 않아 하루 정도의 RTO/RPO로

정의하는 경우가 여전

• RTO/RPO 이슈보다는 저비용 고효율 백업-

복구 시스템 개선에 관심

(예) 최신데이터를 위한 증분 백업, 중복제거 등

HOS, DIST의 경우 5시간~3일 수준으로

RTO/RPO를 정의했으나 최근에는 진료중단,

물류유통중단 시 복구 체계에서 RTO/RPO에

대한 중요성을 크게 느끼고 있어 보다 빠른

RTO/RPO를 위한 고민이 시작

II.재해복구 트렌드 및 관련 법안

Page 6: [찾아가는세미나] 고객맞춤형 재해복구서비스

RTO (복구목표시간) : 재해 선포 시점 기준, 은행은 3시간 이내, 보험사는 24시간 이내

핵심업무 및 IT시스템 중단으로 인해 피해 최소화를 위해 RTO 최대한 단축

RTO 2시간으로 단축을 3년간 권고하며 이후 의무화 검토중, BIS 금융시장 인프라에 관한 원칙에 복구시간을 최소 2시간에서최대 해당 영업일 이내로 명시되어 있음.

RPO (복구목표시점) : 핵심업무에 대한 데이터는 재해발생시점으로 복구되도록 설정 (RPO 0)

RLO (복구복표수준) : 핵심업무가 정상적으로 복구 및 운영될 수 있도록 설정

1) 재해복구계획 수립 – Logical process based demarcation & RTO reduction

① 대고객업무 (금전거래 발생하거나 업무중단에 따른 재무적 손실이 큰 업무)

② 동일성능수준으로 수행가능한 업무

③ 수작업으로 대체가 안되는 업무

④ 업무중단에 따른 재무적 손실이 큰 업무

(e..g, 보험사의 경우 : 사고접수, 사고조사, 보험금지급, 대출신청, 대출심사, 대출금지급, 신규계약, 계약심사, 계약변경 등)

6

2015년 발표된 금융권의 재해복구센터 운영 가이드에 따라 현 재해복구 운영체계를 다시한번 되짚어 볼 필요가

있습니다.

1

2

3

4

1

2

3

업무현황분석 업무중요도분석핵심업무 선정

핵심업무고려사항

II.재해복구 트렌드 및 관련 법안

Page 7: [찾아가는세미나] 고객맞춤형 재해복구서비스

대고객업무의 추가 용량 확보

7

2) 재해복구센터 구축 – 30km distance rule, earthquake proof, rasied floor loading

7

2

3

4

5

6

7

8

9

10

1 안정성 측면

접근성 측면

기술 측면

비용 측면

재해복구센터 성능기준

향후 증가율 고려

재해복구센터 내진설계

재해복구센터 하중안정성

재해복구센터 운영인력

주센터와 동일한 광역재해에 노출되지 않도록 30Km이상 거리 권고,전력망, 네트워크,

음성통신, 냉각수, 등 공급경로의 다중화 구성 권고

이동인력의 규모 및 시간계획 고려, 운영인력 이원화의 경우는 배제

거리에 따른 적용기술 제약사항 검토, 실시간데이터 복제의 경우 성능저하 문제 발생 가능

거리가 멀어질수록 회선비용등 증가

주센터의 복구업무대상의 최대처리용량을 산정하여 재해복구센터 성능 기준으로 활용,

현저하게 지연 및 데이터 유실 없는 수준 확보

업무 중단시 고객문의 등의 접속 폭주를 대비, 또한 내부업무도 업무처리가 집중되는 것을대비한 추가 용량 확보 필요

핵심업무 추가 혹은 기존업무 처리량 증가에 따른 추가 용량 확보 필요

진도 7.0이상 권고

500Kg/m2에 견디도록 적용

재해발생시 실제업무가 처리가능한 수준 이상으로 확보

대응수준 및 숙련도 확보

II.재해복구 트렌드 및 관련 법안

Page 8: [찾아가는세미나] 고객맞춤형 재해복구서비스

8

3) 재해복구센터 운영관리 – Currency of DR site in comparison to Production site

평상 시 운영 조직 필요 :

재해복구계획 유지 및 관리1

2 재해 발생 시 운영조직

3 재해복구철차 수립

4 재해복구 전환훈련

5 재해복구센터 운영 고려사항

재해복구 총괄/IT시스템 운영담당/시설관리자/보안관리자

CEO : 전사적 재해복구 총괄

재해대책 위원회 : 재해선포 결정 및 컨트롤타워

재해 대책반 : 재해복구 실무 총괄

시스템/어플리케이션/네트워크/업무 복구반 : 각각에 대한 운영 및 관리

다양한 재해상황 고려 및 재해선포기준 마련

사전준비전환훈련 실행훈련종료 및 평가

훈련 유형 : 1) 실전환 훈련, 2) 실제와 유사한 형태의 가상 데이터로 훈련

재해복구변경사항 확인 :

주센터 변경에 대해 재해복구계획 수정 및 재해복구센터에 적용

재해복구센터 유지보수 및 형상관리 :

주센터의 유지보수, 운영체제, 어플리케이션 형상관리 및 네트워크 설정변경에 대한 반영

재해복구 역할 교육

재해복구센터 보안관리

II.재해복구 트렌드 및 관련 법안

Page 9: [찾아가는세미나] 고객맞춤형 재해복구서비스

9

• 다양한 자연 재해 증가

– 동일본 지진, 미국 허리케인

태국 홍수, 호주 홍수 등 다양한

형태의 자연 재해가 증가함

• 인적/사회적 갈등으로 인한

위협 증가

– 단순 자연 재해 뿐 아니라,

영리 목적의 사이버테러, 종업원

파업, 테러 등과 같은 인적

요인으로 인한 위협 증가

• 금융기관 규제 강화

– 전자금융관리감독규정 강화로

인해 보안 및 업무연속성 관련

처벌규정이 강화됨

• 경영 환경의 복잡화

– 대 고객 채널의 지속적인 증가로

인한 경영 환경의 복잡화

대면서비스 폰뱅킹

인터넷뱅킹 모바일뱅킹 ..

– 다양한 형태의 금융상품 증가,

유관기관의 증가 등으로 인한

경영 환경의 복잡화

• 고객 기대치 증가

– 다양한 채널 확대, 상품 다각화

등으로 인해 장애에 대한

고객들의 눈높이가 높아짐

• IT 에 대한 업무 의존도 증가

– 경영 환경의 복잡화로 인해

금융기관의 IT 에 대한 업무

의존도는 지속적으로 증가함

• IT 의 복잡도 증대

– 신규서비스 창출, 기존상품의

유지 등의 요인으로 인해

IT 시스템과 그 복잡성은

지속적으로 증가함

– 시스템 간의 의존성 증가로 인해

주요 시스템들에 대한 복구

조치만으로는 모든 업무를

재개하기 어려운 상황임

여러가지 변화에 따라 DR은 업무 연속성을 확보하기 위해 선택이 아닌 필수 솔루션 입니다.

외부 환경의 변화 경영 환경의 변화 기술 부문의 변화1 2 3

III. DR의 필요성

Page 10: [찾아가는세미나] 고객맞춤형 재해복구서비스

10

기업들은 클라우드 기반의 재해복구 방식을

채택할 가능성이 3배 더 높아지고

있습니다.(Forrester, “The State Of Business Technology

Resiliency, Q2 2014”)

IDC조사에 따르면 포춘 1000개 기업의 경우 사내 중요

어플리케이션이 1시간동안 장애가 생길경우

5억원에서 10억원의 손실액이 발생한다고 경고합니다.IDC, "DevOps and the Cost of Downtime:

Fortune 1000 Best Practice Metrics, Quantified Stephen Elliot. Dec.

2014, IDC#253155

재해로 인해 기업의 데이터를

복구하지 못 했을 경우 단지 6% 기업만이 생존할 수

있었고 나머지 94%의 기업이 2년 내에 도산"Taming the Digital Dragon: The 2014 CIO Agenda

The Avoidable Cost of Downtime, Coleman Parkes Research Ltd 2013

IT 다운타임과 데이터 복구로 인한연간 Revenue 손실 (미국 기업 평균)

금융 제조 소매 공공

Small Medium Large

가트너 및 IDC등 유수의 조사기관에 따르면 재해복구에 따른 재정점 손실액은 중견 기업의 경우 약 1억원이상으로

포춘 1000대 기업의 경우 1시간의 장애에도 최고 10억원의 손실을 발생시킨다고 보고하였습니다.

업무 중단에 의한 재정적 Impact

기업규모(직원수 기준)별 손실액

산업부문별 손실액

• 금융 : $224,000 이상

• 제조 : $196,000 이상

• 소매 : $117,000 이상

• 공공 : $99,000 이상

• Large (직원수 1000+): $1M 이상

• Medium (직원수500+): $91,000 이상

• Small (직원수 500-): $55,000 이상

III. DR의 필요성 > 해외 사례

Page 11: [찾아가는세미나] 고객맞춤형 재해복구서비스

11

• 재해복구 시스템이 존재하지 않음재해발생 후 복구를 위한 Application, data는 보존되어 있음

• 재해복구 준비 : 피해분야 파악, H/W S/W 발주, 대체 회선구축에 4 Weeks 소요추정

• 재해복구 기간 : DR 시스템 복구에 2 Weeks 소요 추정

Time

재해복구 준비(4 Weeks)

재해복구(2 Weeks)

2 Weeks 안정화

500억

재해발생 복구완료

250억

6 Weeks 영업 중단

시스템 안정화(2 Weeks)

Cost of IT Outage매출액 규모: 6500억(/년간)

재해복구 준비(30 day)

재해복구(21 day)

시스템 안정화(30 day)

908억

267억

• 재해복구 기간의 산정H/W자원의 발주 및도입을 위한 준비기간 30일 소요

Cost of IT Outage

매출액 규모: 1조 3000억(/년간)

재해발생

4 Weeks 안정화7 Weeks 영업 중단

복구완료

기업이미지손실

업무 중단 시 기업 이미지에중대한, 또는 부정적인 영향을끼침으로 향후 영업기회 및기업이익에 영향을 미침

손해배상 발생업무 중단 시 계약, 규제 등을기한 내에 이행하지 못함으로써벌금 또는 손해배상을 초래함

내부업무 수행지장 초래

업무 중단 시 연계업무 등 타업무에 심각한 지장을 초래하여업무 생산성을 저하시킴

글로벌 업무수행 지장

초래

업무 중단 시 글로벌시스템과의 연계가 불가능해져닛산코리아 내부 업무 처리 및영업활동에 지장이 발생

영업기회 손실차량, 부품 등의 B2B 세일즈기회가 손실되어, 업무 중단 시직접적인 재무적 손실이 발생함

고객서비스불가

고객 만족도에 직접적인 영향을주는 대고객 서비스 불가 또는서비스 수준의 심각한 저하를초래함

재해복구 시스템의 미비시 재해가 발생하였을때 직접적, 간접적 비용 손실을 모두 정량화 할 수 는 없지만영업

손실액을 바탕으로 한 직접적 재무손실액을 계산한 결과 그 피해는 상당히 큽니다.

산출 전제사항

III. DR의 필요성 > 국내 사례

Page 12: [찾아가는세미나] 고객맞춤형 재해복구서비스

12

직접적 비용손실

장애시 발생한 직접적영업이익 손실

장애시간동안의 간접적비용 손실

고객 신용도 하락

벌금 및 패널티

기업의 평판 및 이미지

IT 재해복구 아키텍쳐설계

IT 서비스 수행 토폴로지

인력 및 프로세스

장애시 비상 업무장소전략

데이터 및 정보의 보호

법규 및 규제 준수 항목

낮음

재해발생시비용 부담

솔루션 도입비용

높음

재해복구 솔루션은 업무 전체에 대한 완벽한 준비가 되어있다면 가장 좋겠지만, 이에 따른 비용 부담을

덜어드리고자 IBM이 귀사에 적합한 비용 대비 최적의 효과가 이루어질 수 있는 솔루션을 제안합니다.

재해복구 레벨

“Smart” 한 최적의가격에최고의 재해복구

솔루션을 준비하시기 바랍니다.

재해복구

최적화

III. DR의 필요성 > 비용 효과적인 솔루션

Page 13: [찾아가는세미나] 고객맞춤형 재해복구서비스

13

Strategy and vision

Organization

Processes

Applications and data

Technology

Facilities

Bu

sin

ess r

esil

ien

ce

재해복구 프레임워크는 HA, 재해시 연속적인 운영 및 인프라 환경을 가장 적합하게 믹스하여 업무 요건을

만족시켜 드릴 수 있도록 제공합니다.

• IT 인프라의 연속성 확보를 위한

온디맨드 접속을을 지원합니다.

• 중단없는 백업 시스템의 확보를

통하여 어플리케이션과 데이터의

연속성 확보 및 업무 연속성을

지원합니다.

• 재난 및 재해에 대비하여 백업을

통한 데이터 저장 및 복구를

지원하여 피해를 최소화 합니다.

Business driven Data driven Event driven

Risk mitigation strategies

IV. 맞춤형 IBM 솔루션 소개 > 프레임워크 (1/2)

Page 14: [찾아가는세미나] 고객맞춤형 재해복구서비스

14

IBM

Resi

liency

Serv

ices

Fra

mew

ork Strategy and vision

Organization

Processes

Applications/Data

IT Infrastructure

Facilities

Work Area

Recovery

Work Area

Recovery

Backup and Restore

CDV

Active –Standby

Infrastructure Recovery

Work Area

RecoveryBCP

업무연속성

확보

컨설팅

서비스

Work Area

Recovery

Backup and Restore

Infrastructure Recovery

Work Area

Recovery

Backup and Restore

클라우드 기반재해복구

Active-Standby실시간

High Availability

DBMS 실시간 이중화

IBM은 산업에 대한 높은 이해도를 바탕으로 리스크에 대한 대비, 업무연속성을 위한 IT운영을 비롯한

End to End 재해복구 솔루션을 제공합니다.

IV. 맞춤형 IBM 솔루션 소개 > 프레임워크 (2/2)

Page 15: [찾아가는세미나] 고객맞춤형 재해복구서비스

• 솔루션 구현계획

• 전산복구 계획 수립

• 테스트

• 유지/관리

• 중요 업무/관련 중요 자원, 자산 분석

• 현재 확보 자원 분석

• 현재 확보자원과필요 자원간 차이 산정

• 솔루션 설계(기술, 조직, 운영, Utility Computing)

• 단계별 재해복구 전략 및 실행계획수립(단기/중기/장기)

• 비예측 재해가능성

• 안전대책 효과분석

• 취약부분 분석

• 잠재력 손실

• 운영상의 위험분석

• 중요 업무 선정

• 업무 중단 손실비용 분석

• 한계 시간/비용 정의

• 복구 필요 자원 분석

• 복구 소요시간

• 복구 절차

15

• 현재 가지고 있거나 향후 발생 가능한 잠재 위험 요소 분석

• 기업의 업무별 업무 중단 시의 영향요소 및 비용적 손실 분석

• 중요 업무에 대한 비상 시 대응 전략

재해복구전략수립은 고객이 가지고 있는 잠재적인 위험요소를 찾고, 비상시 업무연속성 확보하기 위한

중요업무를 분류, 재해복구체계를 마련할 수 있는 방안을 수립합니다.

기대효과

IV. 맞춤형 IBM 솔루션 소개 > IT BCP 컨설팅

Page 16: [찾아가는세미나] 고객맞춤형 재해복구서비스

현황분석 단계

현황분석 결과 정리

업무 지속성 지침 및 규정 파악

자원현황 조사

재해복구체계현황 분석 추진 영역 선정

이행 과제 도출/살세화

이행 과제 우선 순위 정의

과제 이행 로드맵 수립

:: 이행과제 정의 ::

:: 이행 로드맵 수립 ::

재해복구시스템 구축 조직 정의 :

변화관리 방안 도출

:: 이행 체계 정의 ::업무연관 분석

복구그룹 정의

단위업무 정의

업무영향 평가

완화 및 대응방안 제시

위험 분석

주요 위험요인 식별

위험 평가 필요 자원 산정

재해복구 아키텍처 설계

:: 재해복구 설계원칙 정의 ::

:: 재해복구 솔루션 선정 ::

재해복구 설계원칙 정의

:: 재해복구 시스템 설계 ::

투자비용 산출

재해복구 솔루션 검토

재해복구 솔루션 검토

재해복구 프로세스 수립

모의훈련 프로세스 수립

:: 재해복구 체계 설계 ::

운영방안 프로세스 수립

16

IBM은 검증된 컨설팅 수행 방법론과 재해복구전략 수립 방법론을 활용하여 현황분석단계 ,

To-Be 설계 단계, 구현계획 단계로 컨설팅을 진행합니다.

분석결과 검토

단위업무 – IT인프라 Mapping

:: 재해복구 GAP 분석 ::

:: 재해복구 요건 정의 ::

현 재해복구시스템 현황 파악

현 재해복구시스템 현황 그룹화

재해복구요건 vs. 구축현황GAP 분석

:: 재해복구 방향성 ::

재해복구 시스템 방향성 정의

재해복구체계 방향성 정의

재해복구시스템 요건 정의

IV. 맞춤형 IBM 솔루션 소개 > IT BCP 컨설팅

Page 17: [찾아가는세미나] 고객맞춤형 재해복구서비스

17

구분 Level 1 Level 2 Level 3 Level 4 Level 5

RTO(복구시간목표)

1주일 이상 24시간 이내 3~24시간 이내 3시간 이내 수분~1시간 이내

RPO(복구시점목표)

1주일 이상 24시간 이내 6~24시간 이내 0 0

데이터 손실최종 백업시점

이후최종 백업시점

이후최종 백업 시점

이후없음 없음

비용 최저수준 저수준 중수준 고수준 최고수준

재해복구솔루션

백업테이프 소산

재해 시 자원확보

테이프 복구솔루션

백업테이프 소산

전용/공용장비

테이프 복구솔루션

Active-Standby

전용/공용장비

원격지 시점백업

Active-Standby

전용장비

실시간 데이터이중화

Web/WasActive-Active

전용장비

실시간 데이터이중화

Offering

BTCS(백업테이프 소산보관 서비스)

+ WAR

BTCS + 전/공용자원

+ WAR

+ DRMS

CDV + 전/공용자원

+ WAR

+ DRMS

스토리지 실시간데이터 복제솔루션 + 전용자원

S/W 실시간 복제솔루션 + 전용자원

+ WAR

+ DRMS

DBMS 실시간데이터 이중화솔루션 + 전용자원

+ WAR

IBM은 BCP 컨설팅 결과를 통해 Level 1부터 Leve5에 이르기까지 고객 재해복구 요건과 비즈니스 연속성 목적에

따라 다양항 솔루션의 제공이 가능하며, 최근에는 Active-Active 형태의 재해복구서비스로까지 확장

제공 가능합니다.

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션

Page 18: [찾아가는세미나] 고객맞춤형 재해복구서비스

• 재해복구를 검토하는 모든고객

• 재해복구의 기본

• 소산 테이프에 대한 관리 보안

• 소산보관 테이프의 관리 체계

• 데이터 유출 방지를 위한 백업시 암호화

18

대상고객

고려사항

IBM BTCS _ 테이프 원격 보관 서비스

재해복구센터 OperationCenter 주센터

재해복구센터에서 주센터로 복귀할 만료된 ‘백업테이프 함’ 반출, 운송요원이 인수

주센터로 만료된 ‘백업테이프 함’ 운송

주센터에서 만료된 ‘백업테이프 함’ 반입, 고객이 인수

주센터에서 재해복구센터로 소산할 ‘백업테이프 함’ 반출, 운송요원이 인수

재해복구센터로 소산할 ‘백업테이프 함’ 운송

재해복구센터에서 소산할 ‘백업테이프 함’ 반입, 재해복구센터 담당자 인수, 내화금고에보관

1

2

3

4

5

6

4 3

5소산할 백업 테이프

6

만료된 백업 테이프

1

2

• 전산실 재해를 대비하여 데이터 소산으로 최소한의 데이터 확보

• 최소한의 데이터를 통해 비즈니스 재개 가능기 대 효 과

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션 >> Level 1

Page 19: [찾아가는세미나] 고객맞춤형 재해복구서비스

IBM 재해복구 센터

19

당일 발생

로그

System Data

Data Base

전산센터

Tape

보관센터

SAN Switch

IBM LTO

Backbone

Switch

DISK

VPN/FW

Router

Server

Recovery with BTCS _ 테이프를 이용한 복구 서비스

• 기본적인 데이터 소산 고객

• 재해복구목표시간이 1~3일예상되는 고객

• 비즈니스의 IT 의존도가 낮은고객

• 주 5회 이상 백업테이프 소산

• 연 1회 이상 모의훈련 수행

• 주기적 재해복구 대상 업무검토필요

대상고객

고려사항

• 최소한의 비용으로 재해복구 체계 확보

• 비상 시 전산시스템 사전 준비를 통해 업무 지속능력 확보

• 주기적 모의훈련을 통한 비상 시 대응체계 준비

기 대 효 과

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션 >> Level 2

Page 20: [찾아가는세미나] 고객맞춤형 재해복구서비스

20

고객 센터 IBM 재해복구 센터

주센터스토리지

주센터 서버

재해복구 센터전/공용 서버

A

• 주기 백업을 통해 데이터 손실을감안하는 재해복구

• 재해복구목표시간은 3시간과근접한 목표로 하는 고객

• 백업 소요시간을 최소화 하고자하는 고객

• 백업 데이터를 개발 및 테스트에활용하고자 하는 고객

• Application 별 백업 SLA

수립필요

• 백업 주기 및 보관기간에 따른백업 저장공간 산정 필요

대상고객

고려사항

• 하나의 백업 데이터로 개발 및 테스트로 즉시 사용 가능함으로 개발 및테스트 인프라 중복 투자 최소화

• 중복제거 기술로 백업 데이터 및 데이터 전송회선 최소화

• Application API에서 직접 백업 수행됨으로 백업 소요시간 최소화

기 대 효 과

원격지 데이터 백업 솔루션

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션 >> Level 3

Page 21: [찾아가는세미나] 고객맞춤형 재해복구서비스

고객 센터 IBM 재해복구 센터

주센터스토리지

재해복구센터스토리지

주센터 서버 재해복구 센터공용 서버

DWDM DWDM

21

실시간 디스크 미러링

• 데이터 손실 최소화가 필요한고객

• 재해복구목표시간이 3시간이내를 목표로 하는 고객

• 각종 규제 준수를 위해 실시간이중화를 구축하여야 하는 경우(금융감독원 재해복구센터 구축권고안, 정보통신부 정보시스템재해복구지침 )

• 복구의 신속성과 확신성을위해 재해복구센터 상시관리방안 수립 필요

• 비대상 업무에 대하여는백업테이프 소산 필요

• 주기적 재해복구 대상 업무검토필요

대상고객

고려사항

• 재해시에도 손실 없는 데이터 보존이 가능

• 비상 시 최소한의 시간으로 재해복구 대응 수행으로 비즈니스 업무지속능력 향상

• 주기적 모의훈련을 통한 비상 시 대응체계 준비

• SAN Volume Controller(SVC)를 이용 시 이기종 스토리지 복제솔루션을 구축할 수 있음

기 대 효 과

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션 >> Level 4

Page 22: [찾아가는세미나] 고객맞춤형 재해복구서비스

22

Transaction Log

Pump

소스Database

타겟Database

TrailFiles

TrailFiles

CDC CDC

TCP/IPCapture Apply

*CDC (Change Data Capture)

L3 S/W

GSLB 부하분산

L3 S/W

L4 S/W

GSLB

L4 S/W

OUT_DNS OUT_DNS

공인 IP로DNS query

L3 S/W

L3 S/W

실시간 DB log 이중화 + 부하분산

• 백업 데이터 손실없이재해복구목표시간이 수분~1시간이내를 목표로 하는 고객

• 재해복구시스템을 평상시Active로 운영하고자 하는 고객

• 재해복구센터 DB를 평상시 Read

환경으로 활용하고자 하는 고객

• 평상시 WEB/WAS에 대한Active 운영을 위한재해복구센터 상시관리 방안수립 필요

• 비대상 업무에 대하여는백업테이프 소산 필요

대상고객

고려사항

고객 센터 IBM 재해복구 센터

• 재해시에도 손실 없는 데이터 보존이 가능

• Database 의 Transaction Log에 기반하여 변경된 데이터만을 추출하여

동기화 방식으로 Database 수준의 데이터 정합성 및 무결성을 제공

• Checkpoint 는 File 과 DB 로 관리가 되며 모든 장애상황에 대처하기

위해서 다양한 정보를 저장

기 대 효 과

IP

F/S

W

IP

F/S

W

인터넷상위 DNS

IV. 맞춤형 IBM 솔루션 소개 > Managed 재해복구 솔루션 >> Level 5

Page 23: [찾아가는세미나] 고객맞춤형 재해복구서비스

IBM WAR 서비스는 고객의 비즈니스 연속성을 확보하기 위한 비상계획의 일부분으로써 어떠한 상황에서도 업무를

연속적으로 가능 하도록 사무실 환경을 제공하는 대체 근무지 제공서비스 입니다. 평상시 고객을 위하여 준비된 대체 사무

공간 및 일부 주요시스템을 모의 테스트 시 또는 재해 발생시 고객에게 제공합니다.

23

WAR (Work Area Recovery) 서비스

• 전산실이 아닌 본사 및 영업소의 근무지에 대한 재해를 대비한 대체 근무장소

• 비상 시 대체근무지 확보를 통한 Office BCP 계획 확보

• 전사 차원의 비상 대응 가능

기대효과

Office space, Meeting Recovery Support Team

Office Environment Recovery Center

<Workspace, Chair, Telephone>

IV. 맞춤형 IBM 솔루션 소개 > 부가서비스1 >> WAR

Page 24: [찾아가는세미나] 고객맞춤형 재해복구서비스

24

새로운 비즈니스 모델이 재해복구

센터에 반영되지 않음

모바일, 스마트워크 등

주 센터 시스템 구성과

재해복구시스템 불일치로 인한

복구 장애 발생

재해복구 시스템 용량 부족 등,

서비스가 정상적으로 기동되지

않음

형식적이고, 부분적 모의훈련

실시로 실제 상황에서 정상작동

하지 않음

전산 인력부족으로 인한 실질적인

관리 부재

업무A

업무G

업무B

업무D

업무C

업무F

업무E

업무 시스템

비즈니스 흐름에 따라 상호

연관되어있음

주센터 시스템의 구성요소가 지속적으로

변경됨

우선순위,가동절차 등 시나리오가

필요함

비즈니스 중요도 변화에 따라 업무의

우선순위가 지속적으로 변경됨

신규업무 발생시 재해복구 시스템

반영여부 판단이 필요함

재해복구 시스템의 가용성을 확보하기 위해서 재해복구 시스템은 업무 및 시스템 측면에서 항상 최신으로

관리되어야 합니다.

01

02

03

04

비즈니스 환경변화에 대응하기 위한 업무와시스템 연계관리

재해복구 시스템을 최신으로 변경관리

재해상황 별 재해복구 시나리오를 제공

재해 발생시 재해복구 시스템 자동복구

- 업무 및 시스템 우선순위 관리(RTO,RPO)

- 연계업무(시스템)를 고려한 복구 순서제어

- 주 시스템 변경여부 모니터링 및 알림 기능

- 재해복구 시스템 구축 현황관리

- 복구시나리오 등록,변경,삭제 기능

- 모의훈련 시나리오 및 복구테스트 기능

- 업무시나리오 또는 단위 시스템 별 자동복구

- 재해복구 매뉴얼 관리

IV. 맞춤형 IBM 솔루션 소개 > 부가서비스2 >> DRMS

재해복구 자동관리 솔루션의 필요성

Page 25: [찾아가는세미나] 고객맞춤형 재해복구서비스

업무별 RTO,RPO 관리 및시스템과 Mapping Table 관리

업무별 복구 순서제어

시스템 별 RTO,RPO 관리

시스템 구축 현황 관리

시스템 가동/중지 순서 관리

주센터 시스템 변경여부 자동검출

가동/중지/조회 스크립트 배포

복구 시나리오에 따라 재해복구시스템 자동 복구

가동 상황 Logging,장애상황전송

25

재해복구 자동관리 솔루션의 주요기능

통합 원격제어 대쉬보드 S-ALM 기능 통합 메뉴화면

재해복구 구축 현황 조회 (시스템, 데이터 복제 등)

재해복구 시스템 현재 상태 조회

재해복구 시스템 자동복구 시 가동/중지 현황 모니터링

재해복구 구축 복제 대상화일, 복제 제외대상 파일에대한 변경여부

기타 재해복구 관리정보

1

재해복구 자동관리 솔루션은 재해복구 시스템의 복구지연 요인을 해결하고, 본 솔루션은 재해복구 시스템을

최신의 상태로 관리하여, 재해시 신속하고, 안전하게 복구할 수 있습니다.

• 재해복구 시스템을 원격지에서 통합관리 및 모니터링

• 재해복구 시스템을 최신상태 유지

• 다양한 복구 시나리오에 따라 재해복구시스템 자동기동

기대효과

Business Logic Control System Configuration Manager Resources Change Monitor System Command Process2 3 4 5

IV. 맞춤형 IBM 솔루션 소개 > 부가서비스2 >> DRMS

Page 26: [찾아가는세미나] 고객맞춤형 재해복구서비스

• 업무영향분석(BIA) 결과에 따른 재해복구 대상 선정과 등급 분류

- RTO 등급별 분류, RPO 등급별 분류

• 업무 중요도에 따라 차별화된 RTO 적용

- Tier 1 RTO <4 Hr, Tier 2 RTO < 24 Hrs, Tier 3 RTO <1 week

• 데이터 중요도 및 특성에 에 따라 차별화된 RPO 적용

- Tier 1 RPO Near 0, Tier 2 RPO 24Hrs, Tier 3 RPO 1 week

26

A 제조사는 이상기후 및 자연재해 등 다각화된 기업 리스크 요인의 증가에 대응하여 기업경영의 연속성 확보가

필요했고 글로벌 재해 복구 시스템을 운영 중입니다.

재해복구 고도화 (~2014/1Q)

1차:

국내 표준 수립2차: 글로벌 확산

(미주, 유럽)

• IT시스템 분석

• 업무영향분석

• To-be 설계

• 구체적인 이행

계획 수립

• 노후화된 주센터

서버 및 스토리지

교체에 맞춰 기존

재해복구센터 이전

및 솔루션 고도화

• 글로벌 재해복구

시스템 구축

• 최장 5,000km

이상

• 전사적 BCP

체계화

• BCP 관리시스템

구축

• 정기 모의훈련

체계고도화

재해복구전략수립

(2011/4Q)

Value to Customer

글로벌 기업 경영 연속성 확보01• 국내 뿐 아니라 해외 구축 시스템에 대

한 재해복구 시스템 구축 및 복구계획

을 수립하여 다각화된 글로벌 운영 리

스크에 대비

업무요건을 반영한 실질적인

재해복구 시스템 확보02

• IT 시스템이 아닌 업무 관점에서부터

Consultative approach를 통해 실효성

있는 재해복구 시스템을 구축

V. 재해복구 성공사례

Page 27: [찾아가는세미나] 고객맞춤형 재해복구서비스

프로젝트 주요 내용 재해복구 시스템 구성도

• 시스템간 연관관계 및 배치 등에 대하여 정확한

분석 및 구축 수행으로 주센터 이전 시 무중단

서비스로 재해복구 시스템을 활용할 수 있는

준비 신뢰성 높음

• 복구시간/시점목표

– 재해발생시 3시간 이내 복구

– 재해 발생 시점의 데이터 복구

• 인터넷 뱅킹 부문: Active-Active 인프라 적용

• IBM PPRC 솔루션, IBM 메인프레임, Power

Server 활용

• 스토리지 데이터 이중화 솔루션 적용

• IBM, Hitachi, EMC

• 자동 백업 솔루션(IPS) 적용

27

주센터 재해복구센터

Sun

SunFire E6900

Sun

SunFire E6900

복구 대상 서버 군

GSLB

Active Active

IBM, HP, Hitachi 스토리지디스크 솔루션을 통한

데이터 미러링

Sun

SunFire E6900

Sun

SunFire E6900

은행업무, 카드업무, 인터넷 뱅킹

IBM, HP, Hitachi 스토리지DWDM

GSLB

DWDM

인터넷

영업점 영업점 영업점

인터넷 뱅킹 고객

VPN

국내 금융권 중 최대 규모의 재해복구 구축 사업으로 W은행의 주센터 이전시 대고객 무중단 서비스를 제공하기

위해 재해복구 시스템을 운영 시스템으로 활용한 경험이 있는 사례입니다.

프로젝트특징

주요 내용

구축솔루션

V. 재해복구 성공사례

Page 28: [찾아가는세미나] 고객맞춤형 재해복구서비스

28

재해복구센터주센터

1차 백업

WAN

Network

+

SKY HP

StorageIBM

Vㅍ

2차 백업

+

CDVIBM

Storage

중복제거중복제거

국내 CDV 구축 사례로써 백업 데이터 복구 소요시간 단축 및 개발환경에 즉시 지원 요건으로, 노후화 백업 환경을

개선하기 위해 CDV를 도입하고 향후 DR체계 구축을 수행한 사례입니다.

프로젝트 주요 내용 재해복구 시스템 구성도

• 장애 시 즉각적인 복구를 통한 서비스 개시

– 데이터 Restore 과정 및 복구시간 최소화

• 1차/2차 백업시스템 구축 및 데이터 보관

• 기존 보유 스토리지 활용

• SKY를 통한 원격지 2차 데이터 소산

– 향후 DR과 연계 가능

• 백업스토리지 용량 최소화

– 중복제거 및 Dedup 기능

• 개발 및 테스트 용도 활용을 통한개발시간/자원 절감

– Snapshot 기능을 통한 다수 복제본 생성

• 1차 백업용량 : 15TB

• 백업네트워크

– 서비스망과 별도 구성

• 2차 백업

– SKY를 이용한 원격백업 수행

프로젝트특징

주요 내용

구축솔루션

V. 재해복구 성공사례

Page 29: [찾아가는세미나] 고객맞춤형 재해복구서비스

29

가트너는 IBM을 재해복구서비스의리더로 선정하였으며, 재해복구서비스 및 그 실행능력을인정받았습니다.[2015년 2Q]

IBM은 IDC Marketscape 중

DR as a service 제공 회사 중

리더로 손꼽혔습니다. IDC

MarketScape: North America Disaster Recovery-

as-a-Service Provider 2015 Vendor Assessment,

November 2015

IBM은 국내 5개 데이터 센터에서

(서초, 죽전, 송도IBP, 경산,

분당)에서 60여 고객에 대한

재해복구 운영

서비스를 제공하고 있습니다.

IBM

* Source : Gartner, Magic Quadrant for Disaster Recovery as a

Service, John P Morency and Christine Tenneson, 21 April

2015

Gatner는 2015년 IBM을 재해복구 서비스의 전 영역에 걸쳐서 가장 성숙한 컨설팅 및 서비스 제공자로

선정하였습니다. 또한 한국 IBM은 현재 60여개 고객에게 재해복구 서비스를 제공하고 있으며, 필수적으로

재해복구 시스템을 구축해야 하는 금융산업 부문에서는 시장 점유율 1위를 차지하고 있습니다.

ⅤI. IBM 리질리언시 서비스

재해복구서비스 시장에서 IBM의 위치

Page 30: [찾아가는세미나] 고객맞춤형 재해복구서비스