Upload
jaewoo-wie
View
542
Download
1
Embed Size (px)
Citation preview
메인프레임 모니터링 자동화
3270 에뮬레리터를활용한 GUI 모니터링자동화를중심으로
위재우애플트리랩(주)
Apple Tree Lab
Twitter: @appletreelab
Email: [email protected]
2010년 5월
애플트리랩(주)
1. 요약: 메인프레임 모니터링 자동화
- 1 -
고객 이슈
고비용 구조•메인프레임 모니터링을 구현하기 위해서는높은비용 솔루션이소요됨.
• 24시간 메인 프레임 관리를 위해서는 3교대운영원 유지가 필요함.
메인 프레임 운영 Skillet•메인프레임 운영을 위해서는 다년간의 운영경험을 가진 전문가가 필요
•최근국내 메인프레임 고객 숫자 감소로 메인프레임 인력 Pool이 줄어들고 있음.
메인 프레임과 Open 시스템갂의 연동 부분•메인프레임의 장애 이벤트와 오픈 시스템간의이벤트 연동이 기술적인 비호환성으로곤란함.
•따라서메인 프레임 운영 관리 프로세스와오픈시스템의 운영 프로세스가 독립적으로운영될위험이 높아지고 있음.
3270 에뮬레이터에 대한 GUI 매크로 기능(시뮬레이션) 활용•메인 프레임 시스템에 command line으로 접속•이미 만들어짂 JCL을 입력(자동화된 키보드 입력)•화면에 나타난 결과값 수집(캡쳐) 및 에러 처리•결과값에 해당되는 Workflow를 수행함.
메인프레임 운영 지식
자동화된 Rule(매크로)
자동 점검
기 구현된이벤트 통합 콘솔
3270 에뮬레이터
1. 요약: 장애 판별 및 장애 발생 구갂 파악의 자동화
고객의 Needs
경고 이벤트의 홍수• SMS(서버/스토리지 모니터링 시스템),
NMS, AMS(어플리케이션 모니터링 시스템), APM(어플리케이션 성능 관리 시스템)등에서 발생하는 많은 이벤트
실제 장애 여부 파악의 곤란• 많은 이벤트중 실제 장애 상황을 나타내는
이벤트는 이중 일부이며, 시스템 관리자의수작업 확인에 의해 장애로 판별됨.
장애 구갂 파악의 곤란• 모니터링 솔루션 → 상황실 운영원 → 관리
자 A → 관리자 B → 관리자 C의 통지 구조
• 정확한 장애 구갂 파악 및 장애 처리 적임자파악에 긴 시갂이 소요되어 장애 해결 지연으로 귀결됨.
이벤트에 대해 사젂 정의된 상태 점검 Rule의 실행•이벤트 특성에 따라 사젂 정의된 상태 점검 Rule을 실행•시스템/어플리케이션 점검 Rule을 통해 장애 여부를 판단•각 운영팀에서 정의한 Health Check Rule의 수행을 통해 장애 구갂을 판단
하고 담당자에게 통지함.
많은 이벤트중 실제 장애 상황을 통지받고
정확한 장애 구갂과 적임자를 파악하는 방법은?
Critical 이벤트 발생 장애 점검 Rule자동 실행
실제장애?
장애 구갂 파악 Rule의자동/반자동 실행
•시스템관리자•DB관리자•어플리케이션 관리자•협력업체 직원
통지
2. 도입 배경
- 3 -
Needs
프로세스 측면
메인 프레임과 타 Open 시스템의 통합 관리가 곤란
메인 프레임 관리 도구와 IT 서비스 모니터링 도구(이
벤트 통합 콘솔, ITSM)과의 연계 곤란
운영 비용 측면
•메인 프레임 모니터링 도구의 고비용 구조
•용량 증설에 따른 모니터링 도구 비용 증가
•운영원(3교대), 젂문가(고급 이상) 인력 비용 증가
쉽고편리하게그리고비용대비효과적으로메인프레임모니터링을할수있는체계필요
도입배경•메인 프레임을 기갂계 시스템으로 활용
(MF/ UNIX / NT로 이루어짂 컴퓨터 群)
•운영 비용 젃감이 요구되고 있음.
비용 대비 효과적인 모니터링 도구의 적용
메인프레임을기간계시스템으로사용하는기업(금융권등)은메인프레임을포함하는 IT 자원을효율적으로모니터링/관리할
수있는체계가필요함. 특히비용대비효과적으로메인프레임모니터링을할수있는도구가필요함.
3. 기본 원리
- 4 -
사람의 두뇌 기정의된 Workflow
매크로기능
키보드와마우스의움직임으로나타나는모니터링활동을매크로기능을활용하여시뮬레이션합니다.
이를통해사람이하는것과유사한모니터링환경을구현합니다.
4. 메인 프레임 이벤트와 통합 모니터링 도구와의 연계 방안
- 5 -
주기적인 모니터링(최대 1분)
•명령어를 자동으로 Key In•결과값과 예상 결과값을 비교
DB
결과값을DB화
특정값을Capture
Critical 이벤트 발생
장애 점검 Rule자동 실행
실제장애?
장애 구갂 파악 Rule의자동/반자동 실행
•시스템관리자•DB관리자•어플리케이션 관리자•협력업체 직원
통지
리포트 시스템
5.시스템 구성도
- 6 -
데이터 연계
데이터저장
데이터 수집
관리 대상시스템
데이터 처리
메인프레임 모니터링 자동화 솔루션
데이터 수집 도구(Data Collector)
ANSI(telnet)3270 DB GUI 통합
Workflow 생성 및 처리 자동화: AutoMate BPA 7
ITSMBEM 보고서 모바일
메인프레임 모니터링 도구 ITSM ERP그룹웨어
이메일/공지결재등
작업/요청자산 정보
변경 작업 여부
WorkFlow
데이터저장소
BPA Management Console
BPA Task Console
DB
6. 도입 효과
- 7 -
구분 도입전 도입후 기대효과
메인프레임
모니터링도구BMC,IBM의모니터링도구
BMC, IBM의모니터링도구
3270 에뮬레이터모니터링도구구축/운영비용최소화
통합이벤트관리 BMC PEM
Open 기반솔루션
BMC BEM(BMC Event Manager)
IBM Tivoli Enterprise Console
전사적통합이벤트관리가가능
기능이우수한솔루션활용
리포팅방안 고가의전문 솔루션사용RDB와의연계
상용리포팅도구사용운영분석활동이가능하게됨.
자동화방안 JCL을사용GUI 기반의
Workflow를사용
능동적인운영환경
(장애시처리절차등을자동화함)