30
Data Architecture Professional 데이터아키텍처와 DAP의 업무 2006. 4 엔코아컨설팅 명재호 이사

Data Architecture Professional 데이터아키텍처와 · 3 데이터아키텍처개요 · 아키텍처의 정의 – 아키텍처란 “구성요소의 구조, 구성요소들 사이의

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Data Architecture Professional

데이터아키텍처와DAP의 업무

2006. 4

엔코아컨설팅 명재호 이사

2

Agenda

– 데이터아키텍처 개요

– 데이터아키텍처 범위

– 데이터아키텍처와 데이터 거버넌스

– DAP의 역할과 업무범위

3

데이터아키텍처 개요

· 아키텍처의 정의

– 아키텍처란 “구성요소의 구조, 구성요소들 사이의 관계, 구성요소의 설계 그리고 시간경과에따른 구성요소의 발전을 위한 원리와 지침” - IEEE Std. 1971

– 아키텍처는 대상에 대한 구조뿐만 아니라, 대상 구조의 유지 관리를 위한 원칙과 지침, 그리고향후 목표 아키텍처로 가기 위한 계획을 포함

– 아키텍처의 구성요소

규칙(Rule)

모델(Model)

계획(Plan)

•전략

•원칙/지침

•표준

•참조 모델

•비즈니스 아키텍처

•데이터아키텍처

•어플리케이션 아키텍처

•기술 아키텍처

•이행 계획

•구축 계획

4

·전사아키텍처란 복잡한 기업의 모습을 다양한 측면에서 분석하고 표현하

여 이해하기 쉽도록 정보체계를 구축하고 이를 활용하는 것

·기업의 목표와 요구를 잘 지원하기 위해 IT 인프라의 각 부분들이 어떻

게 구성되고 작동되어야 하는가를 체계적으로 기술하는 것

·“조직 및 업무활동과 정보기술 간의 관계를 현재 모습과 향후 추구할

모습을 별도로 정의한 청사진” - OMB 회람 A-130

·전사아키텍처란 복잡한 기업의 모습을 다양한 측면에서 분석하고 표현하

여 이해하기 쉽도록 정보체계를 구축하고 이를 활용하는 것

·기업의 목표와 요구를 잘 지원하기 위해 IT 인프라의 각 부분들이 어떻

게 구성되고 작동되어야 하는가를 체계적으로 기술하는 것

·“조직 및 업무활동과 정보기술 간의 관계를 현재 모습과 향후 추구할

모습을 별도로 정의한 청사진” - OMB 회람 A-130

데이터아키텍처 개요

· 전사아키텍처 정의

·기업의 비즈니스와 시스템의 복잡도 증대

·시스템에 대한 전체적 파악이 어려워지고 변경이 곤란해지고 있음

·이러한 복잡한 시스템을 쉽게 파악할 수 있고, 변화시킬 수 있는 설계도

와 같은 것 필요

·기업의 비즈니스와 시스템의 복잡도 증대

·시스템에 대한 전체적 파악이 어려워지고 변경이 곤란해지고 있음

·이러한 복잡한 시스템을 쉽게 파악할 수 있고, 변화시킬 수 있는 설계도

와 같은 것 필요

출현배경출현배경

전사

아키텍처란?

전사

아키텍처란?

전사아키텍처 필요

5

데이터아키텍처 개요

· 전사아키텍처 프레임워크 구성

– 국내에서 적용되고 있는 전사아키텍처 프레임워크의 예

EA 수립 시 먼저 EA 프레임워크를 정립하는데, EA 프레임워크는 EA에 대한 최상위 정의 체계로, EA 수립 프로젝트를 수행하는 데 있어 모든 작업의 기준이 된다.

6

데이터아키텍처 개요

※ DA: Data Administrator

※ 데이터품질 지침은 한국DB진흥센터 개발(04~06년)

· 데이터 관리 프레임워크

7

데이터아키텍처 범위

• 데이터 구조

• 데이터 구조에 데이터 표준 요소 적용

• 데이터 구조의 각 수직 Layer간의 Alignment

• EA(Enterprise Architecture)에서의 데이터아키텍처

8

데이터아키텍처 범위

• 데이터 구조

데이터 구조(설계도)를 평면적이고 시스템적인 내용으로만 생성, 관리하는 것이 아니라 입

체적이고 비즈니스 정보까지 포함된 형태로 관리하는 것이 바람직하다.

9

데이터아키텍처 범위

· 데이터 표준 ( 모델 표준, 데이터 요소 표준 )

표준 용어,도메인 신청/승인

데이터 표준 영향도분석

전행 표준 데이터를전행 사용자에 배포

신청/승인

배포/활용

데이터 표준 운용시스템

표준 영향도 분석

표준 코드 준수/미준수분석 조치

표준 용어 준수/미준수분석 조치

검증/분석

계정계계정계

정보계정보계

채널채널

……....

전사 데이터 표준리파지토리

용어표준

코드표준

명명규칙

도메인표준

데이터모델표준

데이터표준관리프로세스

10

데이터아키텍처 범위

· Alignment– 최상위의 개괄적 모델로부터 단계적 상세화(Level-of-Detail)에 의해 개념적 모델, 논리적 모델을 도출하고,

구현하고자 하는 데이터베이스 시스템의 환경적 조건 등에 맞춰 물리적 모델로 구현된다.

– 각 상세화 단계에서 도출된 데이터 구조 간에는 얼라인먼트(Alignment)에 의해 상호 연동되며, 하향식(Top-Down), 상향식(Bottom-Up) 접근에 의해 구체화 또는 상호 보완된다.

11

데이터아키텍처 범위

· 데이터 통합 측면에서의 데이터아키텍처

데이터 통합 프레임워크는 데이터 통합에 대한 최상위 정의 체계로, 데이터 원칙, 데이터아키텍처, 데이터 관리 부문으로 구성된다. 이는 기본적으로 EA 프레임워크와 연계성을 가져야 한다.

12

데이터아키텍처 범위

· EA 상에서의 DA

데이터아키텍처가 의미가 있기 위해서는 전체 업무와 범위가 일치되어야 하고, 타 영역과의 연계가잘 되어야 하고, 상위 수준의 아키텍처와 하위 수준의 아키텍처가 잘 연계되어야 한다.

①범위 통합 : EA 범위 전체에 대한 각 모델 내의 불일치 제거②수평 통합 : 관련된 타 영역과의 불일치 제거③수직 통합 : 오너, 설계자, 개발자간의 불일치의 제거

13

데이터아키텍처와 데이터 거버넌스

기본(BAS)

품질(DQM)

활용(APP)

구조(STR)

표준(STD)

메타관리

시스템

메타 관리 대분류 기능

메타 Repository

메타 Portal

구현

구현

체계적인 데이터표준화 관리

DB 관리의 효율화

전사 데이터 품질 관리

개발 관리의 효율성

시스템 활용의효율성 향상

효과극대화

· 데이터 관리범위

14

데이터아키텍처와 데이터 거버넌스

데이터관리는 데이터 관리 조직 안에서 데이터 관리 프로세스를 가지고 데이터 품질,데이터 흐름(ETL),

모델링 툴(또는 리파지토리)등과 연계될 때 비로소 완성되게 된다.

15

데이터아키텍처와 데이터 거버넌스

표준 데이터는 전사 데이타 청사진 및 정보 디렉토리로서 Repository에 적재 및 관리되어, 데이터 관리 체계를 통하여 IT 개발 프로세스 및 업무 프로세스의 데이터 관련 이슈를 통제하고, 사용자는 원하는 데이터의 위치, 접근 방법 등의 정보를 활용함으로써 데이터 자산의 가치 제고 및 보호를 수행합니다.

메타데이타

브로커

경영계

영업계

시설계

추출/

정제/

변환

통합D

B

데이터 품질 관리

품질 평가 기준 및 지표

비즈니스룰 표준데이타

전사데이타 청사진

표준 데이타 관리 시스템

정보

디렉토리

메타데이타

원천시스템

마케팅본부-고객 세분화/패턴분석-고객 획득/유지/

발전/재탈환

의사결정권자-전사 경영전략 정보-수익분석정보

사업부문장/지사장-예측정보/조기경보-매출 정보, 기술통계

시설본부-가입자 실선수-전력사용량, 전송로수-통화트래픽

데이터 관리 체계

정보 요청 평가 개발 이행

IT 개발 프로세스

업무 프로세스

시스템 추가/확장

시 데이터 구성 기준

제공으로 데이터의

정합성 향상

기획

생산

마케팅

판매

서비스원하는 데이타의

즉각적인 정보

검색

표준 데이터 기반의

시스템 연계 및 통합

16

데이터아키텍처와 데이터 거버넌스

전사 데이터 품질 성숙도 평가

Data Service요청

Data Service 처리

전행 통합 Data Service

Information PortalSSO WEB Mail SMS

Data Structure Management

데이터모델 구조품질

오너쉽Alignment

데이터표준

DB

전사 데이터 통합관리의 궁극적 목표인 Data Governance 완성을 위해 데이터 각 영역별

역할과 상호 관계 관리가 중요하다. 특히 이러한 내용들은 통합된 구조에서의 설계와 점진적인

추진이 필수적이다.

Data ContentsManagement

BR 관리 영향분석

값 품질Meta Data

프로파일링

변화관리

Data OperationManagement

모델운용 형상관리

만족도관리

정보요구사항관리

DB운용

흐름관리

전사 BIZ관리

전사Application

관리

Workflow내부 Call Center

Data Service 피드백

Data Service 사후관리

경영진

관리자

IT 담당자

현업,개발자

Feedback Feedback

17

DAP 역할 및 업무범위

· 데이터아키텍처 전문가 정의

데이터아키텍처 전문가(DAP, Data Architecture Professional)란 효과적인 데이터아키텍처 구축을위한 전사아키텍처와 데이터품질관리에 대한 지식을 바탕으로 데이터 요건분석, 데이터 표준화, 데이터 모델링, 데이터베이스 설계와 이용 등의 직무를 수행하는 실무자를 말함.

데이터요건분석

데이터품질관리

전사아키텍처

DB설계와이용

데이터모델링

데이터표준화

DAPDAP

18

DAP 역할 및 업무범위

수집, 분석된 정보요구사항이 업무 기능, 업무 프로세스, 데이터로 적절하게 반영되

었는지 분석

정보요구사항에 대한 완전성 및 일관성을

검증

정보요구사항정보요구사항 검증검증

정보요구사항정보요구사항 조사조사

요구사항 파악을 위한 사용자 인터뷰, 설문, 현행시스템 자료 수집

정보요구사항정보요구사항 분석분석

수집 정리된 정보요구 사항을 바탕으로 분석대상을 정의

정보요구사항을 데이터측면에서 구체화, 상세화한다.

· 데이터 요건 분석 정의

정보시스템 구축을 위해 기업 내에 흩어져 있는 많은 정보들을 사용자 관점에서 체계적으로조사 분석하고, 도출된 정보요구 사항이 누락되거나 추가 보완할 사항이 있는지 검정하는 것

19

DAP 역할 및 업무범위

· 데이터 요건 분석 정의

반영 계획 수립반영 계획 수립

신규시스템개발

요구사항 관리요구사항 관리

요구사항 발송

요구사항 수렴

요구사항 검토

영향도 분석

반영여부?

미반영사유통보

처리유형?

반영작업계획 수립

데이터표준변경

데이터모델변경

N

Y

공식화

사용자

정보 요구 사항을 비롯하여 관련 애플리케이션 및 시스템 전반에 걸친 사용자의 요구를수집하고 분류하여 반영하는 작업 절차

20

DAP 역할 및 업무범위

· 데이터 품질 관리 정의

“지식작업자가 데이터를 활용하여 업무 목적을 달성할 수 있도록 지속적으로 기대 수준을 만족시키는 것” -Larry English -

사용자 관점의 만족도

편리성, 활용성 관점

필요할 때 필요한 정보를 확보할 수 있는

가?

활용활용 ( ( Presentation)Presentation)

정의정의((Definition)Definition)

데이터 사양 및 메타데이터

데이터 표준화 및 데이터 구조

데이터 값이 비즈니스에 맞게 정의

값값 ( ( Contents )Contents )

데이터 값의 정확성

완전성 , 일관성

값의 비즈니스 규칙의 준수성

21

DAP 역할 및 업무범위

테이블 및 속성에 대한 Owner 관리

원하는 데이터를 쉽게 파악 관리 기능

데이터의 비즈니스 룰 정의

각 시스템별 관리되고 있는 데이터에 대한 전사적인 공유

도메인 표준 검증

표준 코드를 준수하는지 검증

데이타의 품질 기준 값 및 무결성

데이터 구조의 완전성 검증 ( 정규화, 반정규화의 타당성

검증 )

각 시스템간의 데이터 의미가 동일한 데이터에 대한 정합성

집합간의 관계 정합성

각 시스템간의 데이터 매핑의 일관성 확보

데이터의 중복 관리에 따른 데이터 정합성

각 시스템의 동일한 집합에 대한 Dimension별 데이터의 정합성

데이터 관리 업무 규칙

특정 데이터의 변경에 따른 데이터 정합성 유지 방안

데이터 가공에 대한 기준 SQL문

데이터 관리에 대한 표준 지침서

데이터의 활용도

데이터 표준

데이터간 정합성

데이터 관리

데이터의품질

관리 항목선정

데이터의품질

개선 결과

데이터의품질측정

데이터 품질개선 활동

데이터 품질관리

완전성완전성,,명확성명확성정확성정확성, , 일관성일관성, , 유용성유용성

· 데이터 품질 관리 정의

22

DAP 역할 및 업무범위

데이터 요소에 대한 표준화 실시

데이터 표준 관리 프로세스 절차 수립 및

검증

상시적인 표준화 준수 유도 및 검증

데이터데이터 표준표준 관리관리

데이터표준화데이터표준화 개요개요

데이터 표준화 필요성 정의 및 배포

데이터 표준화 저해 요소 및 개선 방안 수립

데이터 표준화를 위한 구성요소 및 관리도구

데이터표준화데이터표준화 수립수립

데이터 표준화 구성 요소별 규정 원칙 및

수립

확정된 데이터 표준에 대한 배포 및 교육

· 데이터 표준화 정의

시스템 별로 산재해 있는 데이터 정보요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여이를 전사적으로 적용하는 것을 의미한다. 이러한 데이터 표준화 작업은 데이터의 정확한 의미를파악할 수 있게 할 뿐만 아니라, 데이터에 대한 상반된 시각을 조정하는 역할을 수행

23

DAP 역할 및 업무범위

· 데이터 표준화 정의

– 시스템별 산재해 있는 데이터 정보요소에 대한 전사적 적용 원칙을 말함

– 데이터 정보요소

· 데이터 명칭

· 데이터 정의

· 데이터 형식

· 데이터 규칙

전사표준적용

데이터 명칭

데이터 정의

데이터 형식

데이터 규칙

한글명

영문명

영문 약어명

데이터 타입

데이터 길이

소수점 이하 길이

24

DAP 역할 및 업무범위

· 데이터 표준 관리 프로세스

25

DAP 역할 및 업무범위

논리논리 데이터데이터 모델링모델링

논리 데이터 모델 생성

속성 정의 및 엔티티 상세화

데이터 모델 정규화 및 이력관리 정책

개념, 물리 모델과의 Alignment관리

데이터데이터 모델모델 관리관리 정책정책

데이터 모델링 필요성 및 기본원칙 수립

전사 데이터 모델 표준 수립 및 배포

데이터 모델링의 중요성 인식

개념개념 데이터데이터 모델링모델링

전사 개념 데이터 모델 생성

주제영역 정의

핵심 엔티티 정의 및 관계 정의

물리물리 데이터데이터 모델링모델링

물리 데이터 모델 생성

데이터 표준 적용 및 검증

논리/물리 데이터 모델 변환

반정규화 수행

· 데이터 모델링 정의

사용자의 요구사항으로부터 데이터의 실체를 나타내는 작업, 복잡한 "현실세계"를 단순화시켜 표현하는

것이며. 사물 또는 사건에 관한 관점(Perspective)을 연관 된 사람이나 그룹을 위하여 명확하게 하는 것

26

DAP 역할 및 업무범위

개념모델

논리모델

물리모델

업무적 요건의 반영

설계적 요건의 반영

전사의 정보체계 표현참조모델

표준화된 모델· 해당 조직의 비전을

수립하는데 필요한

데이터 분류 체계

표현

· 세부적인 내역보다

는 전사 정보가 중

복되지 않고 확장성

있는 체계로 분류하

는 것에 초점을 맞

추어 설계

· 개념모델을 기준으

로 주제영역에 대한

논리적 상세 설계

· 주제영역별 인터페

이스 중심으로 설계

· 조직의 비즈니스를

표준화된 방법으로

표현

· 이해 당사자간의 모

델 이해도를 증진시

키고 일정 수준 이

상의 품질이 보장되

며 모델의 재사용성

과 생산성을 향상

· 논리모델을 기준으

로 대상 데이터베이

스 고려하여 상세

설계

· 주제영역별 인터페

이스 중심으로 데이

터베이스를 고려하

여 설계

해당 조직의 업무 요건을 충족하기 위해서 주제영역과 핵심 데이터 집합, 핵심 데이터 집합 간의 관계

를 정의한 개념모델과 표준화된 참조모델은 상세 논리모델과 물리모델과의 데이터 구조적 정열

(Alignment)을 지원함으로써 전사적인 모델 관리를 가능하게 합니다.

27

DAP 역할 및 업무범위

성능개선을 위한 분석, 이행, 평가 과정 이해

조인 방법과 장단점 이해

애플리케이션 및 서버 성능개선 요소 및 고려사항

데이터베이스데이터베이스 성능성능 개선개선

데이터베이스데이터베이스 설계설계

데이터 모델을 데이터베이스로의 전환

데이터 무결성, 가용성 향상을 위한설계

저장공간, 무결성, 인텍스, 분산, 보안설계

데이터베이스데이터베이스 이용이용

DBMS 및 명령어 실행

데이터 엑세스, 트랜젝션, 백업 및 복구

· 데이터베이스 설계와 이용

데이터모델이 갖고 있는 구조와 규칙을 데이터베이스에 적용하고, DB의 응답시간부터 시스템 처리능력까지 각 상황에 맞는 개선 목표 설정, 이행, 결과 분석

28

DAP 역할 및 업무범위

- 저장공간설계

- 테이블은 목적에 맞는 저장구조 설계

- 컬럼은 데이터 타입과 길이를 설계하고 컬럼 순서 결정

- 테이블스페이스와 테이블의 관계를 성능과 관리 편의성을 고려하여 배치

- 무결성 설계

- 무결성 강화 방법에는 프로그램코드, 트리거, 제약조건 사용이 있고 각각의 장단점을 고려하여

무결성 설계

- 실체 무결성, 영역 무결성, 참조 무결성, 사용자 정의무결성은 요구되는 조건에 따라 강화 방법

을 설계

- 인덱스 설계

- 인덱스는 특정 프로그램을 위한 설계가 아닌 데이터베이스에 접근하는 접근경로를 고려하여 설계

- 인덱스 구조를 이해하여 환경에 맞는 인덱스를 설계

- 분산 설계

- 분산설계는 위치분산, 분할분산, 복제분산 방법이 있음

- 분할 원칙은 완전성, 재구성, 상호중첩배제를 적용하는 것

- 보안 설계

- 보안 기본 모델은 주체, 객체, 규칙들의 관계 정의 필요

- 접근 제어 유형에는 값(Value) 비 종속 규칙, 값(Value) 종속 규칙, 의미 종속 규칙으로 나눔

· 데이터베이스 설계와 이용

29

DAP 역할 및 업무범위

- DBMS는 인스턴스와 데이터베이스로 구성되어 있다.

- 인스턴스는 메모리와 프로세스로 구성된다.

- 데이터베이스는 논리적인 레벨(테이블, 테이블스페이스)과 물리적인 레벨(데이터 파일)로

분리되어 있다.

- SQL 질의는 옵티마이저가 작성한 실행 계획에 의해서 실행된다.

- 데이터베이스 명령어는 DDL, DML, 세션 제어, 시스템 제어, 트랜잭션 제어 언어로 구성되어 있다.

- 트랜잭션은 원자성, 일관성, 고립성, 영속성의 특성이 있다.

- 병행 제어, 2PC, 교착 상태 등에 대한 개념 및 활용방법은 숙지한다.

- 복구 전략에 의해서 백업 방법이 결정된다.

- 복구는 백업된 로그 파일과 백업 파일을 이용하여 REDO, UNDO 작업으로 이루어 진다.

· 데이터베이스 이용

30

DAP 역할 및 업무범위

- 데이터베이스 성능 개선 방법론

- 성능 개선 작업은 분석, 이행, 평가 순으로 진행

- 성능 개선을 하기 위해서는 트레이스, 실행계획, 서버상태를 확인할 지원도구가 필요

- 성능 개선 목표는 처리능력, 처리시간, 응답시간, 로드시간 등이 있음

- 조인

- Nested-loop 조인, Sort-merge 조인, Hash 조인이 대표적인 조인 형태임

- Nested-loop 조인은 응답속도가 빨라 온라인 프로그램에 적용

- Sort-merge 조인, Hash 조인은 연결고리가 없어 수행이 가능하며 대용량처리 적합

- 응용 애플리케이션 성능개선

- 온라인 프로그램은 응답속도를 목표로 배치프로그램은 처리시간(Throughput)을 목표로 튜닝

접근 필요

- 온라인 프로그램은 실행 계획을 최적화하기 위해 인덱스를 이용한 액세스 경로 개선, SQL

재작성으로 실행계획 개선, 힌트를 이용한 실행 계획 변경 등이 있음

- 서버 성능 개선

- 서버 성능 개선은 인스턴스, 데이터베이스, 네트워크 부분으로 구성

- 인스턴스는 메모리, 프로세스를 대상으로 최적화

- 데이터베이스는 데이터저장을 위한 블록(Blocks), 익스텐트(Extents), 세그먼트(Segments),

데이터 파일을 대상으로 성능 개선 수행

· 데이터베이스 성능 개선