16
데데데데데데데데 (DW) 2005. 5

데이터웨어하우스 (DW)

  • Upload
    gella

  • View
    122

  • Download
    4

Embed Size (px)

DESCRIPTION

데이터웨어하우스 (DW). 2005. 5. 목 차. 개 념 정 의 필요성 시스템 구성 DW 의 특징 Mart 구성 방법 OLAP 도입효과. 개념. 신속하고 정확한 의사 결정을 위해 기업 내부 및 외부 소스로부터 데이터를 수집하고 관리하기 위해 기업내의 분포되어 있는 다양한 Data 를 모아놓은 저장소로써 경영층 및 관리층의 의사결정지원 (Decision Support) 을 주목적으로 함. 의사결정을 위하여 정보를 필요로 하는 사람들에게 필요한 시간에 원하는 방식으로 접근할 - PowerPoint PPT Presentation

Citation preview

Page 1: 데이터웨어하우스 (DW)

데이터웨어하우스 (DW)

2005. 5

Page 2: 데이터웨어하우스 (DW)

- 2 -

1. 개 념2. 정 의3. 필요성4. 시스템 구성5. DW 의 특징6. Mart 구성 방법7. OLAP

8. 도입효과

목 차

Page 3: 데이터웨어하우스 (DW)

- 3 -

1. 개념 신속하고 정확한 의사 결정을 위해 기업 내부 및 외부 소스로부터 데이터를 수집하고 관리하기 위해 기업내의 분포되어 있는 다양한 Data 를 모아놓은 저장소로써 경영층 및 관리층의 의사결정지원 (Decision Support) 을 주목적으로 함

Repository

처방데이터 상병데이터 . .수익데이터 의사결정을 위하여 정보를

필요로 하는 사람들에게필요한 시간에 원하는 방식으로 접근할

수 있도록 하는 것입니다 .

Page 4: 데이터웨어하우스 (DW)

- 4 -

2. 정의

진료 . 경영 . 관리 등의주제별 재구성 Data

수년간의각 부서에서

발행한 데이터와 외부 정보를 주제별로통합하여

별도의 프로그램 없이

사용자 스스로즉시에여러 각도로분석이 가능한

통합 의료정보시스템

처리 목적 Data(OCS, 검사 , 원무 )

경영분석

진료분석

통계정보

Page 5: 데이터웨어하우스 (DW)

- 5 -

3. 필요성

병원 내부 데이터 병원 내부 시스템 병원 내부 프로세스 사용자 인식의 변화 외부 환경의 변화• 대용량 데이터의 축적• 지속적인 분석 / 반영이 안됨• 데이터로부터 지식 획득 / 활용이 어려움• 보다 세분화된 분석 ,

통계 및 환자진료에 대한 자료 요구

• 의사 결정 시스템의 부재• 통합적 분석 정보의 축적 / 분석 미비• 정형화된 자료 중심의 보고서

• 분석 툴 기능의 활용 미비 ( 타부서 의존 )• 많은 수작업으로 인해 분석정보의 적시성 미흡

• 사용자의 Needs 의

다양화와 고도화

• 고객 요구 수준 향상

• 병원간의 생존 경쟁 심화• 환자 진료 분석을 통한 대외 전략 수립기능 확보 필요 • IT 기술의 발전에 따른 대용량의 데이터처리 와 신속한 분석을 요구

문제제기

- 병원내의 분산된 데이터의 통합 / 정보화- 다양한 진료 / 연구를 위한 지원 정보 요구- 신속 정확한 의사결정 지원 요구

Data Warehouse 의 필요성- 병원 경영현황의 보다 정확한 파악- 차별화된 의료 서비스 기반 제공- 경쟁적 우위 달성

Page 6: 데이터웨어하우스 (DW)

- 6 -

• ETL(Extraction, Transformation, Loading, ETT 와 동의어 ) 이란 OLTP 으로부터 필요한 데이터를 추출 (Extract) 하여 변환 (Transformation) 작업을 거쳐 타겟 시스템 (Target System) 으로 전송 및 로딩 (Loading) 하는 모든 과정• 메타데이타 : 어떤 Data 를 어떻게 저장할 것인가 정의하고 , 데이터를 찿기 위한 인덱스 정보를 가지고 있는 데이터• 데이타마트 : DW 에 저장된 정보를 주제별 (EIS, CIS 등 ) 로 중복 저장하는 장소• OLAP(On-Line Analytical Processing) : User 가 DW 나 Mart 에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용

4. 시스템 구성운영계(OLTP) 데이터 웨어하우스 OLAP 사용자

ETL( 대상 Data 추출 )

Data Warehouse( 대용량 저장장치 )

ROLAP/Report

WEB basedAnalysis

병원장

관리자

의사간호사관리

RDBMS

지원업무

RDBMS

기타

RDBMS

OCSMetadata

DataMart

DataMart

DataMart

DataMart

EIS

CIS

보고서

기 타

Page 7: 데이터웨어하우스 (DW)

- 7 -

5. DW 특징

특징

주제지향성 (Subject Orientation)

통합성 (Integration)

비휘발성 (Non-Volatility)

시계열성 (Time-Varient)

Page 8: 데이터웨어하우스 (DW)

- 8 -

5. DW 특징

; 통합의 관점에서 조직이 갖고 있는 정보를 업무 중심이 아닌 특정 주제 중심으로 구성하는 것

Operational Data Warehouse

A B C D

A B C D

A B C D

A B C D 질병별분석

환자별분석

처방별분석

약품별분석

주제중심

원무업무진료업무지원업무외부자료

Applications

A

B

C

D

● 주제지향성 (Subject Orientation)

Page 9: 데이터웨어하우스 (DW)

- 9 -

3. DW 특징

; 같은 성격을 갖는 데이터의 표현을 단일화하는 것

성별

Operational

Appl A – m, fAppl B – 1, 2Appl C – x, yAppl D – male, female

Appl A – cmAppl B – inchesAppl C – mcfsAppl D - yards

Appl A – description AAppl B – description BAppl C – description C

Appl A – key char(10)Appl B – key dec fixed(9,2)Appl C – key pic ‘999,999’Appl D – key char(12)

m, f

Cm

description

Key char(12)

Data Warehouseencoding

measurement

Description from multiple sources

Conflicting keys

단위

설명

● 통합성 (Integration)

Page 10: 데이터웨어하우스 (DW)

- 10 -

5. DW 특징

; 원시데이터로부터의 로딩 (Loading) 과 적재된 자료에 대한 검색 (Query) 이며 자료의 변경 및 삭제와 같은 휘발성 (Volatile) 작업은 없다

레코드 단위로 데이터 조작 대단위의 데이타 로드 및 엑세스

Operational Data Warehouse

Insert

Delete

Change

Select

Select

Load

Access Only

● 비휘발성 (Non-Volatility)

Page 11: 데이터웨어하우스 (DW)

- 11 -

5. 특징

; 일정한 기간동안의 데이터를 저장하여 시점별로 분석 가능 . 즉 , DW 에 저장되는 각각의 레코드에 시간이라는 필드를 갖게 하여 조회시 , 과거 - 현재 - 미래 등 시간 흐름상 추세를 분석

• 검색하는 순간의 데이터의 정확성이 중요• Key Structure may/may not contain an element of time

• 이미 정해진 어느 한 시점의 정확성이 중요• 일정기간 단위별로 ‘ Snap Shot’ 형식으로 저장• Key Structure contain an element of time

Operational Data Warehouse

● 시계열성 (Time-Varient)

Page 12: 데이터웨어하우스 (DW)

- 12 -

장점• 빠른 implementation • 빠른 투자 회수 (ROI)I• 부분적인 제어• data 는 IT 에 의존하지 않고 사용

단점• 여러가지 data models 이 발생• data model 에 통일성 떨어짐• manage/maintain 을 위해서는 여러 interface 가 필요• No single version of the truth• data 의 중복이 발생

장점• Single Version of the Truth• IT 에 의한 정제된 data• data medels 의 통일성• 완벽한 data transformation• 유연한 data mart 구성

단점• data warehouse 가 존재해야 함• 기업의 전략과 일치하여야 함

6. Data Mart 구성 방법독립적 Data Mart 종속적 Data Mart

Page 13: 데이터웨어하우스 (DW)

- 13 -

① 정의 : 최종 사용자 (end-user) 가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정

② 목적 : DW 나 Mart 로 구성된 자료를 최종사용자는 온라인상에서 직접 데이터에 접근

하며 , 대화식으로 정보를 분석하므로 최종사용자가 기업의 전반적인 상황을

이해할 수 있게 하고 의사결정을 지원하는데 그 목적이 있음

7. OLAP 소개가 . OLAP(On-Line Analytical Processing) 의 정의와 목적

나 . OLAP 특성 ① 다차원성 : 사용자들이 실질적인 차원에서 정보를 분석하도록 한다 .

② 직접접근 : 사용자가 전산 부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에

직접 접근한다 .

③ 대화식 분석 : 사용자는 시스템과의 상호작용을 통해 정보를 분석하며 원하는 결과를

얻을때 까지 계속해서 분석을 수행한다 . ④ 의사결정에 활용 : 사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원한다 .

Page 14: 데이터웨어하우스 (DW)

- 14 -

일반적으로 OLAP 툴은 MOLAP, ROLAP, DOLAP, HOLAP 로 구분된다 .

• MOLAP(Multidimensional OLAP) : 다차원 데이터베이스에 기반한 OLAP 아키텍처 .

- 원하는 정보를 사전에 다차원데이타베이스 (MDB) 에 저장한 후 필요시 즉시 조회하는 툴

- 정보의 유형별로 MDB 를 사전에 구성해 놓아야 함으로 IT 직원의 업무가 가중

- 사용자는 사용하기 편함

• ROLAP(Relational OLAP) : 관계형 데이터베이스에 기반한 OLAP 아키텍처 .

- MDB 를 서로의 관계 정보를 다양하게 조회할 수 있도록 하는 툴

- 최근 병원업계에서는 ROLAP 을 사용하는 추세

OLAP 과 관련하여 가장 많은 논란이 되는 것은 MOLAP 제품과 ROLAP 제품 사이의 선택이다 .

ROLAP 제품은 일반적으로 MOLAP 제품에 비해 복잡한 비즈니스 로직을 반영하기 힘들고

다차원 연산기능이 부족한 반면 , MOLAP 제품은 ROLAP 제품에 비해 대용량의 데이터를

처리하지 못함 .

7. OLAP 소개다 . OLAP Tool 비교

Page 15: 데이터웨어하우스 (DW)

- 15 -

7. OLAP 소개

MOLAP ROLAP

특성 다차원 모델링 및 질의도구 다차원 질의 도구

데이터 조작 읽기 / 쓰기 읽기 중심데이터 요구량 대용량 초대용량연산 기능 다양한 연산 제한된 연산개발 주체 최종 사용자 주도형 전산부서 주도형

라 . MOLAP 과 ROLAP 의 비교

Page 16: 데이터웨어하우스 (DW)

- 16 -

8. 도입 효과

가 . End-User Comouting 구현으로 업무처리가 단순

나 . 일관성있는 데이터를 기반으로 신속 정확한 의사결정지원 (DSS) 이 가능

다 . 업무의 중복성 및 업무절차의 복잡성이 대폭 감소

라 . 과거 자료에 의한 추론 및 자료추적이 가능 – 공중보건정보에 활용