9
구축된 병원 DW경영,원무,진료지원등에 국한되어 있으며 임상 연구 부분의 전문성을 높이기 위한 CDW (Clinical Data Warehouse) 부재. CDW임상연구분석, 간호연구분석,검색 등의 임상연구검색시스템을 지원하는 시스템입니다.(몇몇 병원에서 CDW 구축하였다고하나,연구 검색에서 SQL GENERATOR 지원 수준임.) EDW 및 CDW 시스템 1. EDW 및 CDW(Crinical Datawarehouse) 시스템의 차이 임상 데이타 분석 임상연구검색 경영,일반관리분석 EDW 시스템 원무,보험,진료지원 각종 통계 CDW 시스템 질환예측분석 진료지표분석

1 . EDW CDW(Crinical Datawarehouse) 시스템의차이 · 2013-07-25 · cdw 개념도 병원 의료진의 연구 활동을 위한 상 연구 데이타(연구검색데이타, 연구분석데이타),

  • Upload
    lydat

  • View
    324

  • Download
    3

Embed Size (px)

Citation preview

기 구축된 병원 DW는 경영,원무,진료지원등에 국한되어 있으며 임상 연구 부분의

전문성을 높이기 위한 CDW (Clinical Data Warehouse) 부재.

CDW는 임상연구분석, 간호연구분석,검색 등의 임상연구검색시스템을 지원하는 시스템입니다.(몇몇 병원에서

CDW 를 구축하였다고하나,연구 검색에서 SQL GENERATOR 지원 수준임.)

EDW 및 CDW 시스템

1. EDW 및 CDW(Crinical Datawarehouse) 시스템의 차이

임상 데이타 분석 임상연구검색

경영,일반관리분석

EDW 시스템

원무,보험,진료지원

각종 통계

CDW 시스템

질환예측분석 진료지표분석

CDW 개념도

병원 의료진의 연구 활동을 위한 임상 연구 데이타(연구검색데이타, 연구분석데이타), 경영진을 위한 경영지표, 병원의 진료, 진료지원을 위한 임상진료지표를 제공할 수 있는 시스템

Staging영역

중증인

환자 정보 직원

운영계 1:1 매핑 환자

진단

약품 조직

검사

주제영역

비정형자료

정형자료

입원접수 외래접수

병원코드

조직

진료과코드

이벤트

수술

진단

약품

진단검사결과

영상검사결과

기능검사결과

병리검사결과

진료서식

임상기록

마트영역

임상연구검색

임상연구분석

임상진료 지표

질환 예측 Structural Analyzer 룰(Rule) 기반의 엔터티추출

Text Data Processing

수술기록

마취기록

접수

수술

서식

특이환자

전과전동 응급접수

1

2

3

2. CDW 개념도

주제영역 비정형/정형 데이터 모델링 예시

Staging 영역의 분산 중복된 데이타 구조를 데이터 통합관리 목적으로 주제영역에서 주제 기반으로 데이터 모델링 업무를 수행함

3. CDW 통합 데이터 모델링 방안(정형/비정형)

Staging영역

검강검진 환자정보

건강검진 접수

환자 정보 외래접수

운영계 1:1 매핑

조직

병원

부서정보

인사기본

발령정보

자격정보

병동병실

환자

VIP환자 환자보험정보

환자정보

장애인 중증인 특이환자 처방 수가 이벤트 장비 재무

환자별 주파수

Gleason Score

Volume Tumor

번호 환자 주파수

번호 환자 GS

번호 환자 VT

주제영역

비정형자료

정형자료

패턴사전 용어 사전

환자

접수 검사결과 간호서식

판독소견 진료서식 파싱 매핑

중증인 처방

특이환자

병원코드

공통업무

진료과코드

인사업무

인사기본

부서정보

발령정보

진료의사코드

• 진료의사코드 • 인사기본 • 진료콰코드

• 부서

EMR, OCS, …

xls, doc, pdf, zip, …

SAP Content Analytics

SAP Predictive Analytics

SAP 통합 마스터

SAP BI

(BUSINESS OBJECTS)

SAP Big data Appliance (HANA)

Terminology /Dictionary

환자 MDM

NLP Engine

마스터 관리

상병,진단 MDM

ODS 주제 영역중심 모델

분석Mart/ Table

SAP Datacap

SAP DATA

SERVICE (ETL)

4. NLP (NATURAL LANGUAGE PROCESSING) 처리모형도

5. 임상 데이터 분석 아키텍쳐

병리판독결과

Text Data Processing (자연어 처리)

CDW

병리판독지 분석 DB

병리판독 추출 Entity

Stru

ctu

ral A

nal

yze

r

Lin

guis

tic

An

alyz

er

(Ste

mm

ing

& T

aggi

ng)

사전

기반

En

tity

추출

Ru

le 기반

En

tity

추출

ETL

Do

cum

ent

Filt

eri

ng

ETL

정형 Report

Text/Word/PDF

DB

ETL 기반 자연어 처리 엔진의 Text Data Processing 을 활용하여 병리판독결과지 내에 있는 분석 데이터를 용어사전 및 추출 Rule에 기반하여 CDW 내에 분석용 데이터로 저장하여 사용자의 리포트 생성 및 최적의 연구 검색 환경을 제공.

병리판독 DB

병리판독 DB

사죵자 기반 Entity 추출 Rule

용어사전 기반 Entity 추출 (SNOMED, ICD-9, etc.)

시각화

통계 마이닝 UI 기반 자연어처리엔진

To-Be 연구자료 요청 및 제공 프로세스 As-Is 연구자료 요청 및 제공 프로세스

•연구업무를 위한 자료 관리 체계의 부재

•의료진의 연구검색 대상 자료(환자명단 등) 획득의 수작업

•제공 받은 획득된 연구 자료는 의료진 개별적으로 관리

•연구대상환자명단 온라인 자료 검색 후 획득

•의료진 개인의 임상분석을 위한 텍스트 자료의 통합 관리

•연구 업무를 위한 자료 검색 체계 마련

자료 요청

자료 제공

진료/

EMR

자료 추출

연구분석

진단 ①자료 요청

연구분석

자료 검증 자료 획득의 수작업

온라인 자료 획득 및 분석

6. As-Is & To-Be Image

병원DW시스템을 구축하지만, 의료진을 위한 자료 제공이 미비했던 부분을 보완하여 의료진에게 실질적인 자료 및 정보 제공 할 수 있는 DW시스템을 구축하여, 연구업무를 위한 자료 수집 및 획득의 온라인화하여 의료진 연구 업무를 지원할 수 있는 체계를 마련 함

②자료 검색 검사

수술

약품

폐암

위암

대장암

EMR

연구검색

임상데이타

의무기록실

자료 검증

자료 검증

개인

자료

개인

자료

개인

자료

•••

•••

•••

개인별 자료 관리

자료 요청

자료 제공

자료 요청

자료 제공

①자료 요청

②자료 검색

①자료 요청

②자료 검색 텍스트 마이닝

Data Mart의 임상데이타들을 SAP Predictive Analysis 의 입력 Data로 사용하고, SAP Predictive 에서 제공 하는 Decision Tree, Multiple Regression등의 모형을 활용하여 다양한 질병예측을 통한 맞춤진료 정보를 제공할 수 있음

SAP Predictive Analysis 분석 활용 예시

환자속성Data

임상 실험 Data

기존에 임상의사가 Excel에서 하던 작업을 CDW상에서 자동으로 수행

분석을 위한 데이터 SET SAP Predictive Analysis 모형 활용

행렬 대수학(matrix algebra) Hash 테이블과 regular expressions 상위 레벨 분석 및 통계적 기능 그래프 데이터 마이닝 - Decision Tree - Multiple Regression - Neural Network - 기타 모든 마이닝 알고리즘을 지원

• age,weight, runtime(2km를 달리는데 걸리는 시간) • rstpulse(휴식 시 평균맥박수) • runpluse(달릴 때의 평균맥박수), • maxpulse(달릴 때의 최고 맥박수)를 이용하여 • oxygen(산소 흡수율)을 측정하여, 해당 변수들이 •산소호홉율에 어떤 영향을 주는 살펴본 사례입니다. multiple Regression Model 사용

7. 마이닝 시스템 구축 방안

8. H/W 구성도

H/W 구성도

목표된 CDW 시스템 구성은 대용량 자료 처리 분석을 위한 DW Appliance, Staging 영역을 위한 DB서버, 다중 사용자를 위한 OLAP 서버, 자료 적재를 위한 ETL 서버로 이루어짐

Ethernet

HP(DL380 G7) 또는 IBM(x3650)

CPU: Intel Xeon 2.53 GHz * 2(총 12 Cores)

Memory: 64GB

HDD: 300GB(15K) * 2

O/S: Windows 2008

OLAP 및 검색 서버

ETL 서버

HP(DL380 G7) 또는 IBM(x3650)

CPU: Intel Xeon 2.53 GHz * 2(총 12 Cores)

Memory: 64GB

HDD: 300GB(15K) * 2

O/S: Windows 2008

HP(DL580 E7 4870, 2.0 GHz) 또는 IBM(x3950, 2.4 GHz X5 2x Xeon E7-8870)

CPU: 2.40 GHz * 2(총 20 Core)

Memory: 1TB

Disks – HP(25x146 GB SAS) 또는 IBM(600 GB * 8)

O/S: SUSE Linux

SAP DW 어플라이언스

Storage

SAN (HP EVA4400, 450 GB * 12)

FC Swtich

HP(DL580 E7 4870, 2.0 GHz) 또는 IBM(x3950, 2.4 GHz X5 2x Xeon E7-8870)

CPU: 2.40 GHz * 4(총 20 Core)

Memory: 64 GB

Disks –IBM(600 GB * 1)

스테이징 서버

9. S/W 구성도

목표된 CDW 시스템 구축을 위하여 사용자 중심의 OLAP분석 체계, 자료적재 및 검색 성능의 극대화, 최적화된 ETL 성능을 고려하여 S/W를 구성함

S/W 시스템 구성도

메모리기반 자료 적재 및 검색 성능의 극대화

•모든 데이터 처리가 메모리 내에서만 처리하여 적재, 검색, 연산 성능 극대화 •저장 데이터의 80% 압축된 데이터 크기로 대용량 데이터 처리 •서버 기반 통계분석용 R Engine

최적화된 ETL 적용

•연계 시스템 메타정보 및 데이터 품질 관리 •비정형 데이터 처리 •데이터 품질 모니터링 •변경 영향도 분석으로 관리비용 최소화

사용자 중심 OLAP 분석 체계 구축

•웹과 모바일 기반 다차원 분석 툴 •대화형 대시보드 •사용자 통계분석용 데이터 마이닝 •분석데이터의 시각화

In-memory Analytics Appliance In-Memory Computing Engine

SAP In-Memory Database

Metatdata Manager

Row & Column Storage

Modeling Studio In-Memory Calculation Engine

R-Operator

SQ

L In

terfa

ce

R Engine

RServe

R-Runtime

Libraries Shared Memory Manager

DW- Appliance

OLAP Web Intelligence

Crystal Report

Dashboard Designer

Live Office Explorer Mobile / Widget

고급 분석 (Data mining)

Data Mining

Data Visualizatio

n

OLAP및 연구검색 서버

ETL (추출 /정제/ 적재)

ETL 서버

DI Transform SDK

DS Platform

TDP DQ

Data Services Information Steward

모니터링

패턴 룰 정의

용어 룰 정의

데이터 분석

In-memory Analytics Appliance DBMS

스테이징 서버

데이터 저장

• 전체 데이터 저장 관리 • 저렴한 비용 효과