Upload
lydat
View
324
Download
3
Embed Size (px)
Citation preview
기 구축된 병원 DW는 경영,원무,진료지원등에 국한되어 있으며 임상 연구 부분의
전문성을 높이기 위한 CDW (Clinical Data Warehouse) 부재.
CDW는 임상연구분석, 간호연구분석,검색 등의 임상연구검색시스템을 지원하는 시스템입니다.(몇몇 병원에서
CDW 를 구축하였다고하나,연구 검색에서 SQL GENERATOR 지원 수준임.)
EDW 및 CDW 시스템
1. EDW 및 CDW(Crinical Datawarehouse) 시스템의 차이
임상 데이타 분석 임상연구검색
경영,일반관리분석
EDW 시스템
원무,보험,진료지원
각종 통계
CDW 시스템
질환예측분석 진료지표분석
CDW 개념도
병원 의료진의 연구 활동을 위한 임상 연구 데이타(연구검색데이타, 연구분석데이타), 경영진을 위한 경영지표, 병원의 진료, 진료지원을 위한 임상진료지표를 제공할 수 있는 시스템
Staging영역
중증인
환자 정보 직원
운영계 1:1 매핑 환자
진단
약품 조직
검사
주제영역
비정형자료
정형자료
입원접수 외래접수
병원코드
조직
진료과코드
이벤트
수술
진단
약품
진단검사결과
영상검사결과
기능검사결과
병리검사결과
진료서식
임상기록
마트영역
임상연구검색
임상연구분석
임상진료 지표
질환 예측 Structural Analyzer 룰(Rule) 기반의 엔터티추출
Text Data Processing
수술기록
마취기록
접수
수술
서식
특이환자
전과전동 응급접수
1
2
3
2. CDW 개념도
주제영역 비정형/정형 데이터 모델링 예시
Staging 영역의 분산 중복된 데이타 구조를 데이터 통합관리 목적으로 주제영역에서 주제 기반으로 데이터 모델링 업무를 수행함
3. CDW 통합 데이터 모델링 방안(정형/비정형)
Staging영역
검강검진 환자정보
건강검진 접수
환자 정보 외래접수
운영계 1:1 매핑
조직
병원
부서정보
인사기본
발령정보
자격정보
병동병실
환자
VIP환자 환자보험정보
환자정보
장애인 중증인 특이환자 처방 수가 이벤트 장비 재무
환자별 주파수
Gleason Score
Volume Tumor
번호 환자 주파수
번호 환자 GS
번호 환자 VT
주제영역
비정형자료
정형자료
패턴사전 용어 사전
환자
접수 검사결과 간호서식
판독소견 진료서식 파싱 매핑
중증인 처방
특이환자
병원코드
공통업무
진료과코드
인사업무
인사기본
부서정보
발령정보
진료의사코드
• 진료의사코드 • 인사기본 • 진료콰코드
• 부서
EMR, OCS, …
xls, doc, pdf, zip, …
SAP Content Analytics
SAP Predictive Analytics
SAP 통합 마스터
SAP BI
(BUSINESS OBJECTS)
SAP Big data Appliance (HANA)
Terminology /Dictionary
환자 MDM
NLP Engine
마스터 관리
상병,진단 MDM
ODS 주제 영역중심 모델
분석Mart/ Table
SAP Datacap
SAP DATA
SERVICE (ETL)
4. NLP (NATURAL LANGUAGE PROCESSING) 처리모형도
5. 임상 데이터 분석 아키텍쳐
병리판독결과
Text Data Processing (자연어 처리)
CDW
병리판독지 분석 DB
병리판독 추출 Entity
Stru
ctu
ral A
nal
yze
r
Lin
guis
tic
An
alyz
er
(Ste
mm
ing
& T
aggi
ng)
사전
기반
En
tity
추출
Ru
le 기반
En
tity
추출
ETL
Do
cum
ent
Filt
eri
ng
ETL
정형 Report
Text/Word/PDF
DB
ETL 기반 자연어 처리 엔진의 Text Data Processing 을 활용하여 병리판독결과지 내에 있는 분석 데이터를 용어사전 및 추출 Rule에 기반하여 CDW 내에 분석용 데이터로 저장하여 사용자의 리포트 생성 및 최적의 연구 검색 환경을 제공.
병리판독 DB
병리판독 DB
사죵자 기반 Entity 추출 Rule
용어사전 기반 Entity 추출 (SNOMED, ICD-9, etc.)
시각화
통계 마이닝 UI 기반 자연어처리엔진
To-Be 연구자료 요청 및 제공 프로세스 As-Is 연구자료 요청 및 제공 프로세스
•연구업무를 위한 자료 관리 체계의 부재
•의료진의 연구검색 대상 자료(환자명단 등) 획득의 수작업
•제공 받은 획득된 연구 자료는 의료진 개별적으로 관리
•연구대상환자명단 온라인 자료 검색 후 획득
•의료진 개인의 임상분석을 위한 텍스트 자료의 통합 관리
•연구 업무를 위한 자료 검색 체계 마련
자료 요청
자료 제공
진료/
EMR
자료 추출
연구분석
진단 ①자료 요청
연구분석
자료 검증 자료 획득의 수작업
온라인 자료 획득 및 분석
6. As-Is & To-Be Image
병원DW시스템을 구축하지만, 의료진을 위한 자료 제공이 미비했던 부분을 보완하여 의료진에게 실질적인 자료 및 정보 제공 할 수 있는 DW시스템을 구축하여, 연구업무를 위한 자료 수집 및 획득의 온라인화하여 의료진 연구 업무를 지원할 수 있는 체계를 마련 함
②자료 검색 검사
수술
약품
폐암
위암
대장암
EMR
연구검색
임상데이타
의무기록실
자료 검증
자료 검증
개인
자료
개인
자료
개인
자료
•••
•••
•••
개인별 자료 관리
자료 요청
자료 제공
자료 요청
자료 제공
①자료 요청
②자료 검색
①자료 요청
②자료 검색 텍스트 마이닝
Data Mart의 임상데이타들을 SAP Predictive Analysis 의 입력 Data로 사용하고, SAP Predictive 에서 제공 하는 Decision Tree, Multiple Regression등의 모형을 활용하여 다양한 질병예측을 통한 맞춤진료 정보를 제공할 수 있음
SAP Predictive Analysis 분석 활용 예시
환자속성Data
임상 실험 Data
기존에 임상의사가 Excel에서 하던 작업을 CDW상에서 자동으로 수행
분석을 위한 데이터 SET SAP Predictive Analysis 모형 활용
행렬 대수학(matrix algebra) Hash 테이블과 regular expressions 상위 레벨 분석 및 통계적 기능 그래프 데이터 마이닝 - Decision Tree - Multiple Regression - Neural Network - 기타 모든 마이닝 알고리즘을 지원
• age,weight, runtime(2km를 달리는데 걸리는 시간) • rstpulse(휴식 시 평균맥박수) • runpluse(달릴 때의 평균맥박수), • maxpulse(달릴 때의 최고 맥박수)를 이용하여 • oxygen(산소 흡수율)을 측정하여, 해당 변수들이 •산소호홉율에 어떤 영향을 주는 살펴본 사례입니다. multiple Regression Model 사용
7. 마이닝 시스템 구축 방안
8. H/W 구성도
H/W 구성도
목표된 CDW 시스템 구성은 대용량 자료 처리 분석을 위한 DW Appliance, Staging 영역을 위한 DB서버, 다중 사용자를 위한 OLAP 서버, 자료 적재를 위한 ETL 서버로 이루어짐
Ethernet
HP(DL380 G7) 또는 IBM(x3650)
CPU: Intel Xeon 2.53 GHz * 2(총 12 Cores)
Memory: 64GB
HDD: 300GB(15K) * 2
O/S: Windows 2008
OLAP 및 검색 서버
ETL 서버
HP(DL380 G7) 또는 IBM(x3650)
CPU: Intel Xeon 2.53 GHz * 2(총 12 Cores)
Memory: 64GB
HDD: 300GB(15K) * 2
O/S: Windows 2008
HP(DL580 E7 4870, 2.0 GHz) 또는 IBM(x3950, 2.4 GHz X5 2x Xeon E7-8870)
CPU: 2.40 GHz * 2(총 20 Core)
Memory: 1TB
Disks – HP(25x146 GB SAS) 또는 IBM(600 GB * 8)
O/S: SUSE Linux
SAP DW 어플라이언스
Storage
SAN (HP EVA4400, 450 GB * 12)
FC Swtich
HP(DL580 E7 4870, 2.0 GHz) 또는 IBM(x3950, 2.4 GHz X5 2x Xeon E7-8870)
CPU: 2.40 GHz * 4(총 20 Core)
Memory: 64 GB
Disks –IBM(600 GB * 1)
스테이징 서버
9. S/W 구성도
목표된 CDW 시스템 구축을 위하여 사용자 중심의 OLAP분석 체계, 자료적재 및 검색 성능의 극대화, 최적화된 ETL 성능을 고려하여 S/W를 구성함
S/W 시스템 구성도
메모리기반 자료 적재 및 검색 성능의 극대화
•모든 데이터 처리가 메모리 내에서만 처리하여 적재, 검색, 연산 성능 극대화 •저장 데이터의 80% 압축된 데이터 크기로 대용량 데이터 처리 •서버 기반 통계분석용 R Engine
최적화된 ETL 적용
•연계 시스템 메타정보 및 데이터 품질 관리 •비정형 데이터 처리 •데이터 품질 모니터링 •변경 영향도 분석으로 관리비용 최소화
사용자 중심 OLAP 분석 체계 구축
•웹과 모바일 기반 다차원 분석 툴 •대화형 대시보드 •사용자 통계분석용 데이터 마이닝 •분석데이터의 시각화
In-memory Analytics Appliance In-Memory Computing Engine
SAP In-Memory Database
Metatdata Manager
Row & Column Storage
Modeling Studio In-Memory Calculation Engine
R-Operator
SQ
L In
terfa
ce
R Engine
RServe
R-Runtime
Libraries Shared Memory Manager
DW- Appliance
OLAP Web Intelligence
Crystal Report
Dashboard Designer
Live Office Explorer Mobile / Widget
고급 분석 (Data mining)
Data Mining
Data Visualizatio
n
OLAP및 연구검색 서버
ETL (추출 /정제/ 적재)
ETL 서버
DI Transform SDK
DS Platform
TDP DQ
Data Services Information Steward
모니터링
패턴 룰 정의
용어 룰 정의
데이터 분석
In-memory Analytics Appliance DBMS
스테이징 서버
데이터 저장
• 전체 데이터 저장 관리 • 저렴한 비용 효과