21
데데데 데데데데데 데데 데데데 데데데데데 데데 1. 1. 데데데 데데데데데 데데데데데 데데데 데데데데데 데데데데데 2 2 데데데데 데데데데 ~13 ~13 데데데데 데데데데 2.OLAP(On Line Analysis Process) T 2.OLAP(On Line Analysis Process) T ool ool 13 13 데데데데 데데데데 ~21 ~21 데데데데 데데데데

데이터 웨어하우스 목차

  • Upload
    hollis

  • View
    79

  • Download
    0

Embed Size (px)

DESCRIPTION

데이터 웨어하우스 목차. 1. 데이터 웨어하우스 개발방법론 2 슬라이드 ~13 슬라이드 2.OLAP(On Line Analysis Process) Tool 13 슬라이드 ~21 슬라이드. 데이터 웨어하우스 개발방법론. 04606035 이병규 04606003 김기훈. 데이터 웨어 하우스. 데이터웨어하우스 개발단계 계획 분석 설계 구현 교육및 문서화. 1) 데이터웨어하우스의 계획 단계. 계획단계는 병원 데이터 웨어하우스시스템을 구축하기 위한 전체적인 일정이나 범위를 선정하는 일련의 과정을 말함 . - PowerPoint PPT Presentation

Citation preview

Page 1: 데이터 웨어하우스 목차

데이터 웨어하우스 목차데이터 웨어하우스 목차

1.1. 데이터 웨어하우스 개발방법론데이터 웨어하우스 개발방법론 22 슬라이드슬라이드 ~13~13 슬라이드슬라이드

2.OLAP(On Line Analysis Process) Tool2.OLAP(On Line Analysis Process) Tool 1313 슬라이드슬라이드 ~21~21 슬라이드슬라이드

Page 2: 데이터 웨어하우스 목차

데이터 웨어하우스데이터 웨어하우스개발방법론개발방법론04606035 04606035 이병규이병규04606003 04606003 김기훈김기훈

Page 3: 데이터 웨어하우스 목차

데이터 웨어 하우스데이터 웨어 하우스데이터웨어하우스 개발단계데이터웨어하우스 개발단계

계획계획분석분석설계설계구현구현교육및 문서화교육및 문서화

Page 4: 데이터 웨어하우스 목차

1)1) 데이터웨어하우스의 데이터웨어하우스의 계획계획단계단계

► 계획단계는 병원 데이터 웨어하우스시스템을 구축하기 위한 전체적인 일정이나 범위를 선정하는 계획단계는 병원 데이터 웨어하우스시스템을 구축하기 위한 전체적인 일정이나 범위를 선정하는

일련의 과정을 말함일련의 과정을 말함 ..

► 종합병원은 다양한 전문가 집단으로 구성된 특수한 조직이기 떄문에 각 전문가 집단별 데이터를 종합병원은 다양한 전문가 집단으로 구성된 특수한 조직이기 떄문에 각 전문가 집단별 데이터를

분석하는 시각에서도 많은 차이를 나타냄분석하는 시각에서도 많은 차이를 나타냄 ..

► 프로젝트를 추진하는 업무추진위원회와 각 전문 집단을 대표하는 실무자 협의회를 구성하여 현재 프로젝트를 추진하는 업무추진위원회와 각 전문 집단을 대표하는 실무자 협의회를 구성하여 현재

발생하는 데이터와 추가로 필요한 데이터들을 분석하고 각 전문 집단에 알맞은 의사결정 유형을 발생하는 데이터와 추가로 필요한 데이터들을 분석하고 각 전문 집단에 알맞은 의사결정 유형을

분류하는것이 주된 역할분류하는것이 주된 역할

► 선진 병원경영 기법을 도입하고 데이터웨어하우스 시스템의 기본이 되는 선진 병원경영 기법을 도입하고 데이터웨어하우스 시스템의 기본이 되는 Server,DBMS, OLAP ToolServer,DBMS, OLAP Tool 의 의

선정에도 참여하여 병원 전체 구성원들의 마인드 확산에도 기여해야함선정에도 참여하여 병원 전체 구성원들의 마인드 확산에도 기여해야함

Page 5: 데이터 웨어하우스 목차

2)2) 데이터웨어하우스의 데이터웨어하우스의 분석분석단계단계

► 분석단계는 현업의 요구사항과 기존 병원정보 시스템을 분석하여 사용자들의 분석단계는 현업의 요구사항과 기존 병원정보 시스템을 분석하여 사용자들의

요구사항을 충복시킬 수 있는 지식 인프라를 선정하는 단계요구사항을 충복시킬 수 있는 지식 인프라를 선정하는 단계 ..

► 실무자 협의회를 최대한 활용하여 현업의 요구사항을 충분히 조사하고 현재 실무자 협의회를 최대한 활용하여 현업의 요구사항을 충분히 조사하고 현재

운영중인 운영중인 OLTPOLTP 시스템을 분석하여 현업의 요구와 현 시스템의 데이터를 매칭시스템을 분석하여 현업의 요구와 현 시스템의 데이터를 매칭 ..

► OLTPOLTP 에서 처리된 데이터들의 오류를 분석하여 수정 및 보완작업을 제안에서 처리된 데이터들의 오류를 분석하여 수정 및 보완작업을 제안

► 의료정보 지식 의료정보 지식 FrameFrame 을 도출하여 효과적인 의사결정을 위한 정형화된 형태를 을 도출하여 효과적인 의사결정을 위한 정형화된 형태를

설정설정

Page 6: 데이터 웨어하우스 목차

3)3) 데이터웨어하우스의 데이터웨어하우스의 설계설계단계단계

► 결정된 데이터웨어하우스 서버나 데이터베이스를 셋업하며 지식 결정된 데이터웨어하우스 서버나 데이터베이스를 셋업하며 지식 FrameFrame 과 현업 요구사항을 이용하여 과 현업 요구사항을 이용하여

OLTPOLTP 시스템으로부터 데이터를 추출하는 시스템으로부터 데이터를 추출하는 ETT(Extraction Transformation Transportation)ETT(Extraction Transformation Transportation) 를 설계를 설계

► DSA(Decision Support Area)DSA(Decision Support Area) 을 설계하여 사용자들의 의사결정에 필요한 정보제공이 가능한지 조사을 설계하여 사용자들의 의사결정에 필요한 정보제공이 가능한지 조사

► OLTPOLTP 에서 에서 DataData 를 추출하는 시점과 방법을 설계하며 시스템 성능향상을 위한 기법도 설계를 추출하는 시점과 방법을 설계하며 시스템 성능향상을 위한 기법도 설계 ..

► 이러한 기법들과 분석내용을 기준으로 각 주제 영역별 데이터마트를 설계하고 의료정보 지식 이러한 기법들과 분석내용을 기준으로 각 주제 영역별 데이터마트를 설계하고 의료정보 지식 frameframe

을 제시을 제시 ..

Page 7: 데이터 웨어하우스 목차

4)4) 데이터웨어하우스의 데이터웨어하우스의 구현구현단계단계

► 구현 단계는 설계단계에서 분석되고 설계된 것을 기초로 의료 구현 단계는 설계단계에서 분석되고 설계된 것을 기초로 의료 Fact tablFact tabl

ee 과 과 Dimension tableDimension table 을 작성하고 을 작성하고 ETTETT 와 와 DSADSA 를 기초로 를 기초로 OLAPOLAP 에서 에서 DD

ataata 를 추출하는 를 추출하는 ObjectObject 를작성를작성 ..

► 각 데이터마트를 구성하여 각 데이터마트를 구성하여 OLAPOLAP 에서 데이터마트를 에서 데이터마트를 Setting.Setting.

► 데이터웨어하우스용 데이터베이스에 각 스키마들을 생성시킴데이터웨어하우스용 데이터베이스에 각 스키마들을 생성시킴

Page 8: 데이터 웨어하우스 목차

5)5) 데이터웨어하우스의 데이터웨어하우스의 교육 및 문서화교육 및 문서화 단계 단계

► 교육 및 문서화 단계에서는 병원 데이터웨어하우스의 전문화된 데이터 교육 및 문서화 단계에서는 병원 데이터웨어하우스의 전문화된 데이터

마트들을 연계하는 방안을 모색하고 각 전문집단별 마트들을 연계하는 방안을 모색하고 각 전문집단별 Data OpenData Open 범위를 정함범위를 정함 ..

► 최종사용자들을 대상으로 최종사용자들을 대상으로 OLAP ToolOLAP Tool 사용법과 사용법과 DataData 해석 방법에 대해 교육을 해석 방법에 대해 교육을

실시실시 ..

► 데이터웨어하우스 운영자들에게 데이터 추출을 검증하는 과정과 데이터웨어하우스 운영자들에게 데이터 추출을 검증하는 과정과 OLTPOLTP 에서 에서

수정이 있을경우 데이터 웨어하우스의 수정이 있을경우 데이터 웨어하우스의 ETTETT 나 나 DSADSA 의 수정이 가능하도록 교육 의 수정이 가능하도록 교육

실시실시 ..

Page 9: 데이터 웨어하우스 목차

6)6) 데이터웨어하우스 성능향상을 위한 기법데이터웨어하우스 성능향상을 위한 기법

(1)(1) 데이터웨어하우스전용데이터베이스시스템데이터웨어하우스전용데이터베이스시스템

데이터웨어하우스는 데이터들을 수집하는 개념으로 구성데이터웨어하우스는 데이터들을 수집하는 개념으로 구성

OLTPOLTP 에서 필요한 데이터들을 에서 필요한 데이터들을 ETTETT 과정을 통해 데이터웨어하우스 과정을 통해 데이터웨어하우스 ServerServer 로 로 InsertInsert 하기 하기

때문에 때문에 UpdateUpdate 나 나 deletedelete 등의 작업은 극히 드물게 일어남등의 작업은 극히 드물게 일어남 ..

데이터베이스시스템도 이러한특성에 맞는 기능을 보유한 시스템을 사용하여야 함데이터베이스시스템도 이러한특성에 맞는 기능을 보유한 시스템을 사용하여야 함

많은양의 데이터들을 조합하고 비교함으로써 필요한 정보를 추출하는 데이터웨어하우스는 많은양의 데이터들을 조합하고 비교함으로써 필요한 정보를 추출하는 데이터웨어하우스는

특히 특히 QueryQuery 기능이 우수하고 병렬처리시스템을 지원하는 데이터베이스시스템이 필요기능이 우수하고 병렬처리시스템을 지원하는 데이터베이스시스템이 필요

Page 10: 데이터 웨어하우스 목차

6)6) 데이터웨어하우스 성능향상을 위한 기법데이터웨어하우스 성능향상을 위한 기법

(2)(2) 스타형 스타형 ERD(Entify Relation Diagram)ERD(Entify Relation Diagram) 설계설계

스타형스타형 ERDERD 는 는 updateupdate 나 나 deletedelete 가 거의 발생하지 않고 데이터 량이 많으며 가 거의 발생하지 않고 데이터 량이 많으며

지속적으로 관리해야하는 데이터웨어하우스 시스템에 적절지속적으로 관리해야하는 데이터웨어하우스 시스템에 적절 ..

데이터웨어하우스 내에 존재하는 매우 큰 엔티티를 위한 기초적인 설계로 적용데이터웨어하우스 내에 존재하는 매우 큰 엔티티를 위한 기초적인 설계로 적용 ..

하나의 엔티티에서도 많은 차원을 표시하여 분석하는 데이터웨어하우스 하나의 엔티티에서도 많은 차원을 표시하여 분석하는 데이터웨어하우스

시스템은 스타죠인으로써 다양한 형태의 시스템은 스타죠인으로써 다양한 형태의 QueryQuery 를 효율적으로 수행를 효율적으로 수행 ..

Page 11: 데이터 웨어하우스 목차

6)6) 데이터웨어하우스 성능향상을 위한 기법데이터웨어하우스 성능향상을 위한 기법

(3)(3) 인덱싱 기법인덱싱 기법

인덱스는 데이터가 있는 정보를 보유하고 있어 사용자가 원하는 데이터를 가장 최적화 하여 찾아내는 역할인덱스는 데이터가 있는 정보를 보유하고 있어 사용자가 원하는 데이터를 가장 최적화 하여 찾아내는 역할 ..

데이터웨어하우스에서는 인덱스가 데이터웨어하우스에서는 인덱스가 OLTPOLTP 와는 다르게 구성되는데 데이터의 성격에 관계없이 인덱스를 구성하고 자주 와는 다르게 구성되는데 데이터의 성격에 관계없이 인덱스를 구성하고 자주

사용되는 데이터들을 인덱스로 지정사용되는 데이터들을 인덱스로 지정 ..

데이터웨어하우스에서는 자주 데이터웨어하우스에서는 자주 QueryQuery 될 데이터에 대한 정보가 없고 인덱스가 지정되지 않는 데이터가 없음될 데이터에 대한 정보가 없고 인덱스가 지정되지 않는 데이터가 없음 ..

데이터웨어하우스에서는 모든 데이터에 인덱스가 존재하며 데이터의 증가량보다 인덱스의 증가량이 더 많음데이터웨어하우스에서는 모든 데이터에 인덱스가 존재하며 데이터의 증가량보다 인덱스의 증가량이 더 많음 ..

또한 또한 DWDW의 데이터들은 수행속도와 저장공간의 효율화를 위해 의 데이터들은 수행속도와 저장공간의 효율화를 위해 ETTETT 과정에서 주로 숫자 형태로 변환하고 이것을 과정에서 주로 숫자 형태로 변환하고 이것을 IndexIndex

화 함화 함 ..

Page 12: 데이터 웨어하우스 목차

6)6) 데이터웨어하우스 성능향상을 위한 기법데이터웨어하우스 성능향상을 위한 기법

(4) (4) 형성뷰 기법형성뷰 기법

빈도수가 자주 발생하는 자료들을 별도로 빈도수가 자주 발생하는 자료들을 별도로

유지하여 성능을 향상시키는 가장 좋은 유지하여 성능을 향상시키는 가장 좋은

방법중 하나방법중 하나

별도의 테이블에 저장하는 기법으로 뷰에 별도의 테이블에 저장하는 기법으로 뷰에

대한 스키마대한 스키마 , , 상태 정보와 실제값을 상태 정보와 실제값을

릴레이션과 동일하게 저장릴레이션과 동일하게 저장 ..

단점단점 릴레이션 정보가 릴레이션 정보가 변경되었을 경우 변경되었을 경우 데이터의 일관성을 데이터의 일관성을 위해 변경정보와 위해 변경정보와 뷰를 동일하게 함뷰를 동일하게 함

장점장점 성능과 의사결정에 성능과 의사결정에 수월수월

Page 13: 데이터 웨어하우스 목차

6)6) 데이터웨어하우스 성능향상을 위한 기법데이터웨어하우스 성능향상을 위한 기법

(5)(5) 기타 성능 향상 기법기타 성능 향상 기법

11 데이터와 인덱스를 물리적데이터와 인덱스를 물리적 , , 논리적으로 분산하여 논리적으로 분산하여 Access time, Seek TAccess time, Seek Timeime 을 줄일수있고 집중되는 업무처리를 분산 가능을 줄일수있고 집중되는 업무처리를 분산 가능

22 ServerServer 의 의 Data DiskData Disk 구성 시 여러 개의 구성 시 여러 개의 DiskDisk 를 수직적으로 분할하여 를 수직적으로 분할하여 하나의 논리적 저장공간으로 사용함으로써 일정장소에 집중되는 하나의 논리적 저장공간으로 사용함으로써 일정장소에 집중되는 Access Access time, Seek Timetime, Seek Time 를 분산 가능를 분산 가능

33 네트워크 트래픽분산네트워크 트래픽분산 , , 일정한 네트워크상에 집중되는 트래픽을 일정한 네트워크상에 집중되는 트래픽을 분산하여 시스템의 업무처리를 효율화하고 전산설비의 인프라를 분산하여 시스템의 업무처리를 효율화하고 전산설비의 인프라를 최대한 활용 가능최대한 활용 가능

44 객체를 이용한 성능향상 기법으로 주로 사용하는 정보를 객체화하여 객체를 이용한 성능향상 기법으로 주로 사용하는 정보를 객체화하여 처리한다면 의사결정을 위한 정보처리에 상당항 효과를 나타냄처리한다면 의사결정을 위한 정보처리에 상당항 효과를 나타냄

Page 14: 데이터 웨어하우스 목차

OLAP(OLAP(OOn n LLine ine AAnalysis nalysis PProcesrocess) Tools) Tool

Page 15: 데이터 웨어하우스 목차

OLAP(On Line Analysis Process) ToolOLAP(On Line Analysis Process) Tool

► 데이터웨어하우스시스템은 데이터를 분석할 수 있는 데이터웨어하우스시스템은 데이터를 분석할 수 있는 ClientClient

용 분석 용 분석 ToolTool 로 구성로 구성

► OLAP ToolOLAP Tool 은 다양한 분석과 리포트 기능들을 필요로 하며 은 다양한 분석과 리포트 기능들을 필요로 하며

다음 목록과 같은 환경적 요인과 기능을 포함 다음 목록과 같은 환경적 요인과 기능을 포함

Page 16: 데이터 웨어하우스 목차

OLAP Tool OLAP Tool 기능기능

► Client/Server Client/Server 환경하에서 구동된다환경하에서 구동된다 ..

► 사용자 자신이 정형 및 비 정형사용자 자신이 정형 및 비 정형 (Ad-Hoc Query)(Ad-Hoc Query) 질의를 작성 및 저장할 수 있다질의를 작성 및 저장할 수 있다 ..

► 질의에 따른 최적의 성능 제공이 가능한 테이블을 검색 및 제공하므로 신속한 의사 질의에 따른 최적의 성능 제공이 가능한 테이블을 검색 및 제공하므로 신속한 의사

결정을 제공함결정을 제공함 ..

► 사용자 질의에 부합한 결과 정보만 사용자 질의에 부합한 결과 정보만 ClientClient 에 전송하므로 에 전송하므로 network-Trafficnetwork-Traffic 을 을

감소하는 기능이 필요하다 감소하는 기능이 필요하다

Page 17: 데이터 웨어하우스 목차

OLAP Tool OLAP Tool 기능기능

► 엑셀엑셀 , , 시트시트 , SPSS, SAS, SPSS, SAS 와 같이 통계를 처리할 수 있는 와 같이 통계를 처리할 수 있는 ToolTool 들과 들과

인터페이스가 가능해야함인터페이스가 가능해야함

► 반복적인 보고서는 저장한 후 필요할 경우 재사용 할 수 있다반복적인 보고서는 저장한 후 필요할 경우 재사용 할 수 있다 ..

► 다양한 형태의 보고서를 지원하며 일괄처리기능이 필요하다다양한 형태의 보고서를 지원하며 일괄처리기능이 필요하다 ..

► 연속적인 연속적인 Server(DBMS Connection)Server(DBMS Connection) 연결을 최대한 지양하여 동시에 연결을 최대한 지양하여 동시에

많은 사용자를 수용할 수있는 분석 많은 사용자를 수용할 수있는 분석 ToolTool 이어야 한다이어야 한다 ..

Page 18: 데이터 웨어하우스 목차

실시간분석기법 실시간분석기법 ToolTool 의 의 종류종류

DOLAP

비교적 작은규모의 다차원 분석과 다운로드 된데이터를 비교적 작은규모의 다차원 분석과 다운로드 된데이터를

이용하는 프리젠테이션 관계이용하는 프리젠테이션 관계 TooLTooL 이다이다 ..

설치와 관리가 간단하며 유지보수 부다임적음설치와 관리가 간단하며 유지보수 부다임적음

소규모 데이터 처리에 사용 소규모 데이터 처리에 사용

Page 19: 데이터 웨어하우스 목차

실시간분석기법 실시간분석기법 ToolTool 의 의 종류종류

HOLAPHOLAP

데이터를 동시적으로 다차원 분석이 가능하도록 지원해주는 데이터를 동시적으로 다차원 분석이 가능하도록 지원해주는 ToolTool 을 을

말한다말한다 ..

요약한 데이터와 관계식에 의해 새로 계산된 데이터를 관계형 요약한 데이터와 관계식에 의해 새로 계산된 데이터를 관계형

데이터베이스에 별도로 저장하여 분석하는 과정을 거친다데이터베이스에 별도로 저장하여 분석하는 과정을 거친다 ..

Page 20: 데이터 웨어하우스 목차

실시간분석기법 실시간분석기법 ToolTool 의 의 종류종류

MOLAPMOLAP

Multidmensional OPLAMultidmensional OPLA 로 다차원 데이터베이스에 저장된 데이터들을 로 다차원 데이터베이스에 저장된 데이터들을

분석하는 분석하는 ToolTool

저장과 분석 프로세싱을 동일한 엔진의 사용으로 네트워크의 부하를 저장과 분석 프로세싱을 동일한 엔진의 사용으로 네트워크의 부하를

줄이고 복잡한 조직을 쉽게구현 할수있다줄이고 복잡한 조직을 쉽게구현 할수있다 ..

국내병원에서 사용하는 국내병원에서 사용하는 ToolTool 이 여기에 속함이 여기에 속함

Page 21: 데이터 웨어하우스 목차

실시간분석기법 실시간분석기법 ToolTool 의 의 종류종류

ROLAP ROLAP

Relational OLAPRelational OLAP 로 사용자와 관계형 데이터베이스 사이에 위치하여 로 사용자와 관계형 데이터베이스 사이에 위치하여

사용자들을 대신하여 복잡한 질의를 생성하고 다차원 연산을 수행한다사용자들을 대신하여 복잡한 질의를 생성하고 다차원 연산을 수행한다 ..

클라이언트의 다차원 질의를 적절한 클라이언트의 다차원 질의를 적절한 SQLSQL 로 변환하여 관계형 로 변환하여 관계형 DBMSDBMS

에 넘겨주고 관계형 에 넘겨주고 관계형 DBMSDBMS 로부터 처리된 결과를 다시 다차워 로부터 처리된 결과를 다시 다차워

보고서로 변환하여 클라이언트에 넘겨주는 역활을 함보고서로 변환하여 클라이언트에 넘겨주는 역활을 함 ..