60
H I R A HIRA Big Data Brief No.1 제2권 3호 ISSN 2508-8408

HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

H I R A빅 데 이 터

브 리 프H I R A B i g D a t a B r i e f

No.1

제2권 3호

ISSN 2508-8408

Page 2: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

보건의료 빅데이터 동향 _ 03

Ⅰ-1. 블록체인 기술과 보건의료분야 활용 _ 05

Ⅰ-2. 보건의료 빅데이터 관련 주요 기사 _ 20

HIRA 빅데이터 분석 사례 _ 23

Ⅱ-1. 국내 만성두드러기 유병률 및 치료 패턴 분석 _ 25

Ⅱ-2. 흉추부 황색인대 골화증 유병률 및 관련 요인 분석 _ 31

Ⅱ-3. 소아암 진단의 계절적 추세 및 바이러스 감염 경향 _ 35

HIRA 빅데이터 분석 가이드 _ 41

Ⅲ-1. ‘HIRA 빅데이터 분석 가이드’란? _ 43

Ⅲ-2. HIRA 빅데이터 분석 - 동반질환 분석 _ 44

CONTENTS

Page 3: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료
Page 4: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료
Page 5: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

보건의료 빅데이터 동향에서는

국내ㆍ외 빅데이터 관련 기술 개발, 활용 등

최신 동향과 주요 언론 기사를 소개하고 있습니다.

Ⅰ보건의료

빅데이터

동향

Page 6: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

5

Ⅰ. 보건의료 빅데이터 동향

Ⅰ-1. 블록체인 기술과 보건의료분야 활용

최영진 교수

을지대학교 의료경영학과

1. 들어가는 글

지능화, 디지털, 연결로 대표되는 4차 산업혁명 시대의 핵심기술로 블록체인 기술이 부각되고

있음

시장 조사기관인 가트너(Gartner)는 2017년에 미래 기술 트렌드 중 하나로 블록체인을

선정하였으며, 2020년에 128%의 성장률을 기록하는 등 초고속으로 성장하여 2030년에는

비즈니스 가치가 3조 달러를 초과할 것으로 예측함

세계경제포럼(World Economic Forum)은 가상화폐 중심의 블록체인기술이 향후 제조,

서비스, 문화, 공공분야 전반에 활용되면서 2027년에는 전세계 GDP의 10%가 블록체인

기술을 활용할 것으로 예측함

출처: Gartner, 2017

[그림 1] 블록체인 산업 전망

Page 7: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

6

HIRA 빅데이터 브리프

블록체인 기술은 거래당사자 간의 직접적인 거래를 가능하게 하는 분산원장 기술임

블록체인 기술이란 거래정보를 저장한 블록을 모든 거래당사자가 네트워크를 통해 분산

저장하고 주기적으로 암호화한 후, 체인 형태로 연결하여 저장하는 분산원장 기술임

거래당사자가 중앙집중시스템에 의존하지 않고 peer-to-peer 방식으로 각자의 원장을

분산ㆍ보유하여 거래 중개자를 거치지 않음

또한 원장은 네트워크 참여자 모두에게 공개되며(복사본 보유), 거래자간의 합의가 없이는

변경이 불가능하기 때문에 신뢰성이 있음

중개자(기존의 중앙기관이나 은행 등)의 개입없이도 자산이나 정보의 교환이 가능해지면서

전통적인 사회의 신뢰구조가 블록체인 기반의 신뢰구조로 변화함

출처: IBM (2018)

[그림 2] 거래 방식의 변화

Page 8: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

7

Ⅰ. 보건의료 빅데이터 동향

2. 블록체인 기술 구조

블록체인은 암호화된 블록을 기반으로 한 분산원장, 암호화, 합의, 스마트계약 등의 구성요소를

포함하는 집합체임

[그림 3] 블록체인 구성 요소

블록체인은 해쉬함수 기반의 암호화로 안전한 거래를 보장하며, 블록은 블록해쉬 이외에도

유효한 정보의 묶음으로 블록 헤더와 거래 정보를 포함하는 블록 바디로 구성

블록체인은 거래의 시간 순으로 기록된 장부로 네트워크의 모두가 접근할 수 있는 공개된

분산원장임

블록 헤더는 소프트웨어/프로토콜 버전, 이전 블록의 블록 해쉬, 머클 해쉬, 블록이 생성된

시간, 작업 증명시 이용되는 nonce값으로 구성됨

머클트리(Merkle Tree)는 거래정보에 대한 해쉬로 구성되며, 블록의 바디에 해당함. 개별 거래

정보에 대한 해쉬값을 합친 후 다시 해쉬하는 과정을 거치면서 거래정보가 조작되면, 복사된

체인과 비교하여 조작된 위치를 정확하게 알 수 있도록 구성됨

Page 9: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

8

HIRA 빅데이터 브리프

출처 : 한국보건산업진흥원(2017) 재구성

[그림 4] 블록 및 블록체인 구조

분산원장은 중앙통제 및 전체 시스템 중단 위험을 해결함

분산원장기술(Distributed Ledger Technology)은 중앙서버나 중앙관리자의 제어없이

분산화된 네트워크의 참여자가 정보를 공유하고 동기화하는 기술임

기존의 전통적인 시스템에서는 은행과 같은 제3의 관리기관에 비용을 지불하고 제3자가

권한을 위임받아 서비스와 데이터를 관리하였음

분산원장은 분산되어 있는 네트워크 참여자 각자에게 데이터가 복제ㆍ공유되어, 네트워크

참여자 모두가 원장을 관리하고 동기화함에 의해 거래의 유효성, 단일성을 확보함

분산원장 기술 기반으로 송금이 이루어지는 경우, 거래 정보가 포함된 블록이 생성되고, 이를

네트워크 참여자에게 전송하여 거래의 타당성 확인 후 블록체인에 연결하여 송금이 완료됨

Page 10: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

9

Ⅰ. 보건의료 빅데이터 동향

출처 : KB금융지주경영연구소(2015)

[그림 5] 블록체인 기반 거래 개념도

분산시스템의 신뢰 확보를 위해 합의가 필요함

합의 문제는 분산 시스템의 신뢰도를 보장하기 위해 나온 개념으로 모든 분산 시스템에

참여하고 있는 모든 프로세스가 합의에 의해 동일한 데이터로 결정됨

네트워크 참여자간의 합의는 복잡한 문제로 합의 알고리즘은 모든 참여자가 같은 값을

결정하고 결정된 데이터는 특정 참여자에 의해 제안된 것이어야 하며, 언제나 1 또는 0을

판단할 수 있어야 함

복잡한 합의에 사용되는 알고리즘은 전통적인 Proof of Work 이외에도 Proof of Stake,

Unique Node List, PBFT 등의 방법이 사용됨

Page 11: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

10

HIRA 빅데이터 브리프

[표 1] 합의 알고리즘

Proof of Work Proof of Stake Unique Node List PBFT

- 비트코인에서 사용

- 모든 노드는 블록헤더에 들어갈 해시값을 맞추는 연산 수행

- 채굴에 성공한 노드는 블록을 형성하며 그에 따른 이득을 취함

- 막대한 연산 과정 필요

- PoW의 연산 부담을 줄이기 위해 등장

- 블록 생성 확률이 각 노드가 가진 지분에 따라 결정

- 생성에 성공한 노드는 생성에 따른 이득을 동일하게 받음

- Ripple에서 사용하는 알고리즘

- UNL은 합의의 주최가 되는 선택받은 노드

- 리플에서 추천하는 신뢰 노드 리스트 사용

- 합의구조 참가에 대한 내부적인 보상이 없어 참여노드의 신뢰성이 보장되어야 함

- 참여자들이 한정된 프라이빗 블록체인에서 사용

- 정해진 정도(1/3)를 넘지 않는 한도내에서 fail이 일어나도 정확한 값을 전달

- 검증을 담당하는 validating Peer와 블록 생성 리더로 구분

- 리더가 트랜잭션 정렬 및 블록 생성 후 VP에게 전달

- 3f+1의 피어 중 2f+1이 동의하면 블록체인에 추가

출처: http://www.itworld.co.kr/print/94202

스마트 계약

거래당사자간 합의된 규칙을 코드로 생성, 스마트 계약으로 구현하여 자동화된 거래의 처리를

지원함

스마트 계약은 블록체인에 스크립트 형태로 구현되며, 스마트 계약은 체인 내의 고유한 주소로

접근하여 트랜잭션을 직접 보냄으로써 해당 계약을 처리함

리눅스 재단의 하이퍼레저(Hyperledger)

하이퍼레저는 리눅스 재단에서 주관하는 블록체인 오픈소스 프로젝트로 금융뿐만 아니라 IoT,

물류, 제조, 기술 산업 등 여러 산업에 걸쳐 응용 가능한 블록체인 기술을 추구함

이는 모듈화, 플러그 앤 플레이, 상호 운용성을 지향하며, 스마트 계약을 지원하기 위한 기술로

멤버쉽, 합의, 비즈니스로직 등 세부항목으로 구성되어 있음

Page 12: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

11

Ⅰ. 보건의료 빅데이터 동향

구 분 설 명

멤버쉽 서비스 - 네트워크의 거래 인증에 접근하기 위해서는 모든 개체들이 멤버쉽 서비스에 등록

합의 서비스

- P2P 프로토콜은 HTTP/2 표준을 따른(양방향 스트리밍, 다중 요청 등을 제공하는) Google RPC를 이용하며, 이 프로토콜은 방화벽, 프록시, 보안을 포함한 인터넷 인프라에 포함

- 분산장부는 블록체인을 효율적으로 관리하고 암호화 캐쉬를 계산- 합의 매니저는 합의 알고리즘과 다른 Hyperledger 구성요소 사이에서 인터페이스

역할

비즈니스 로직 서비스

- 확인된 노드들이 실행되는 분산 거래 프로그램으로 체인코드 서비스는 특정 가상 머신이나 컴퓨터 언어에 의존하지 않고 체인노드를 관리하기 위해 Docker를 이용

출처: http://blockchain-finance.com/

[그림 6] 하이퍼레저 구성요소

Page 13: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

12

HIRA 빅데이터 브리프

3. 블록체인 활용 사례

블록체인은 전자화폐 기반의 금융서비스뿐만 아니라 디지털 정보의 안전한 보관과 거래, 그리고

계약 자동화 기능 등을 이용하여 상품 유통 및 공공 서비스에 활용할 수 있음

[표 2] 블록체인 활용 분야 및 사례

구 분 내 용 사례

금융 증권 거래, 청산결제, 송금 등의 금융 서비스에 블록체인을 활용

. Kraken(증권거래)

. Aviva(보험)

. Clearmatics(송금)

. Funderbeam(투자관리)

. Skuchain(무역금융)

일반 산업

상품의 수송 및 유통과정에서 안전성 확보에 활용

. La'Zooz(수송)

. pey(유통)

. Chronicled(보안)

. MaidSafe(스토리지)

. RWE(전력거래)

공공서비스

안전하고 편리한 정보보관 기능을 이용하여 공공서비스에 활용

. Block Notary(공증)

. Chainalysis(신원관리)

. 덴마크(전자투표)

. 에스토니아(전자시민권)

출처: 금융보안원(2017) 재구성

보건의료 분야에서도 의료서비스의 혁신과 비용 효율성을 추구하기 위해 적극적으로 블록체인

기술 활용(Deloitte, 2016; 한국보건산업진흥원, 2017)

미국의 국가의료정보표준(Office of the National Coordinator for Health Information

Technology)의 건강정보교환에서는 네트워크의 모든 참가자의 신원증명 및 인증, 건강정보에

대한 접근 권한을 해결하기 위한 방법으로 블록체인 기술에 대한 관심

또한 정밀, 맞춤형 의료에 대한 관심이 높아지면서 개인의 생체 및 진료정보의 안전한 유통과

디지털 건강기기의 도입 및 이용이 증가할 것으로 예상되면서 이에 대한 확인과 정보유통

수단으로 블록체인 필요성 증가

Page 14: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

13

Ⅰ. 보건의료 빅데이터 동향

보건의료 분야에서 블록체인 기술은 임상시험을 위한 안전한 데이터 공유, 개인주도형 건강관리,

보험청구 심사, 의료기기ㆍ의약품 유통 등에서 활발하게 적용(한국보건산업진흥원, 2017)

Gem Health : 의약품 유통, 자동차 보험, 사회기반 서비스 등 다양한 분야에서 활용 가능한

공유 ID 체계 구축을 목표로 블록체인을 구성

Medibloc : 환자 개인이 직접 여러 의료기관에 분산된 자신의 의료정보를 통합, 관리 및 유통을

할 수 있게 하는 블록체인 기술

Shovom : 환자의 게놈 데이터를 안전하게 저장 및 유통하기 위한 블록체인 플랫폼

Mygenomebox : 개인에게 유전체 분석 결과에 대한 서비스 제공과 확보된 데이터를 제약사

및 연구기관에 제공

Mediledger : 의약품 운반과 공급관리를 위해 개발된 플랫폼으로 모든 처방 의약품과 공급된

의약품을 식별 및 추적관찰

HealthCoin : 만성 질환 합병증 예방을 위해 환자의 행동을 웨어러블 기술로 추적 관찰, 보험사

및 의료기관을 연결해 정보를 제공하고 환자에게 금전적 보상

MedRec

2016년 미국 MIT Media Lab과 이스라엘의 Beth Israel Deaconess Medical Center가

이더리움의 이더 플랫폼 기반 블록체인 원장(MedRec)으로 환자의 약물치료 정보 공유 시험

시험에서는 의료기록이 발생될 경우, 임의 조작이 불가능한 의료기록 로그와 EHR에 대한

접근정보를 환자에게 제공하고 별도의 의료정보 중개기관 없이 환자가 선택한 제3의

의료기관에서 자신의 의무기록에 대한 조회 권한을 제공

의무기록 생성/변경 통지단계에서는 의무기록이 생성되거나 변경되면 블록체인에 Hash값

저장하고 환자의 공개키로 EHR DB 주소 전송

의무기록 내용 확인 단계에서는 환자의 개인키로 생성이나 변경된 의무기록을 확인하고, 환자

스스로 개인의무기록(PHR)에 저장할 것인지 결정

의무기록 공유단계에서는 병원과 환자 간 스마트계약 사용하여 제3자에게 의무기록

생성기관의 EHR 주소를 제공하는 구조

Page 15: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

14

HIRA 빅데이터 브리프

출처 : MIT(2018)

[그림 7] MedRec 시스템 구조

보험 청구 및 지급 사례 : change healthcare

오픈 소스 블록체인 프레임워크인 Hyperledger Fabric 1.0을 사용하여 의료서비스 제공자와

보험지급자간에 청구 및 지불절차를 효율적으로 처리하는 분산 원장

의료 공급자에 의한 보험 청구 이벤트가 발생하면, 워크플로우가 블록체인에 요청 기록하고,

스마트 계약이 구현된 블록체인 이벤트가 워크플로우를 활성화하여 심사한 후 보험금 지급

출처 : Change Healthcare

[그림 8] Change Healthcare 사례

Page 16: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

15

Ⅰ. 보건의료 빅데이터 동향

교보생명의 보험 청구

교보생명과 디레몬이 2017년 과학기술정보통신부의 지원을 받아 블록체인 기술을 활용해

보험계약자에게 실손보험금 등의 자동 지급시스템 개발

기존에 보험가입자가 진료 후 병원비를 수납하고 증빙서류를 발급받아 보험사에 제출하여야

하는 불편한 절차를 보험가입자가 보험금을 따로 청구하지 않아도 병원비 수납 내역과

보험사의 계약정보를 기반으로 보험금 지급하는 서비스

블록체인 기술을 활용하여 보험유지고객이 별도의 보험금 신청없이 보험금을 지급하는

분산원장에 기재된 보험계약을 활용하는 방법으로 보험금 지급조건 충족시 의무기록 사본과

보험금 청구서가 자동 생성되어 청구되는 서비스

출처 : 교보생명(2017)

[그림 9] 교보생명의 보험청구

Page 17: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

16

HIRA 빅데이터 브리프

4. 블록체인 기술 적용

현재 우리나라에서 실시되고 있는 공공 보건의료 서비스 중에서 블록체인 기술 활용이 가능한

분야를 선정하면 의료기관간 진료정보 교류, 의약품 유통 등이 가능함

공공 보건의료 서비스는 기존 제도에서 허가된 기관만 참여가 가능하므로 개방형이 아닌

승인된 기관만 네트워크에 참여하는 폐쇄형 블록체인 적용

[표 3] 공공 보건의료 서비스 적용 분야

구분 진료정보 교류 의약품 유통

개요

- 환자의 과거 진료기록(약물 처방기록, 검사기록 등)을 확인하지 못해 발생하는 약물사고 등 오진을 예방하고, 병원을 옮길 때마다 환자가 일일이 종이나 CD로 진료기록을 발급받아 제출했던 불편함 등을 해소하기 위한 사업

- 의약품의 생산과 수입부터 공급을 거쳐 최종 소비되는 과정의 의약품 유통현황 정보를 수집·조사·가공·이용 및 제공

이해당사자

송신기관, 수신기관, 환자제약사, 요양기관, 도매업체, 의약품관리종합

정보센터

진료정보 교류사업은 4종에 대하여 시범서비스를 통해 과거 환자가 직접 방문하여 의료기록을

종이나 CD로 수령하여 전달하는 불편 해소 가능한 서비스로 블록체인 기술 적용시 파급효과가

예상되므로 블록체인 기반의 진료정보 교류 방법을 설명하면 다음과 같음

의료기관간 진료정보를 교류하기 위해서는 블록체인을 기반으로 네트워크에 참여하는

의료기관이 연결되어야 하는데 의료기관의 자체시스템과 직접 연결이 어려우므로 별도의 중계

서버를 설치

의료기관간 정보의 공유와 상호운용성을 위한 중계 서버를 별도로 두고 이를 매개로 하는 방법이며,

블록체인 기반으로 진료정보 교류를 위해서는 블록관리 부분과 조회 부분으로 구분 필요

블록 관리에서는 A라는 의료기관에서 발급된 인증서가 시스템에 입력되면 해당 데이터를 검증

레이어에 전달하고, 검증이후 공유블록을 생성한 후, 블록체인에 공유블록을 저장 요청하고

상대 의료기관에 전달

Page 18: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

17

Ⅰ. 보건의료 빅데이터 동향

공유블록이 B의료기관에 전달되면 해당 공유 블록을 검증과 합의를 진행한 후 블록체인에 저장

[그림 10] 진료정보교류 시스템 구조

Page 19: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

18

HIRA 빅데이터 브리프

5. 블록체인 한계 및 미래

블록체인 기술은 금융분야 뿐만 아니라 모든 종류의 자산이나 정보의 등록, 보관, 거래에 적용될

것임(과학기술정책연구원, 2017)

초기에는 인증 등 보안 분야를 시작하여 비용절감 효과가 큰 자산에 대한 거래 후 과정,

지불결제 및 송금, 스마트계약 분야로 확산될 것으로 전망됨

4차 산업혁명의 핵심 산업인 보건의료 분야도 블록체인을 이용하여 기존의 거버넌스나

신뢰구조를 빠르게 대체 할 것으로 예상

블록체인은 초연결 사회를 해결해 줄 수 있는 비용 효율적인 대안이지만 아직 기술적으로 해결할

과제들이 존재함

블록체인은 거래처리 시간의 단축, 중개자의 오버헤드 비용 감소로 인한 비용절감, 조작 및

사이버 범죄 위험 감소, 분산원장 및 프로세스 공유로 위변조가 어려워짐에 따른 신뢰성 증가

등의 장점을 가지고 있음

반면 거래 내역이 공개됨에 따라 원칙적으로는 모든 거래가 추적 가능하여 완벽한 익명성

보장이 어려울 수 있으며, 채굴이 대형 마이닝 풀에 집중됨에 따라 실시간, 대용량 처리의

어려움이 존재

블록체인 기술의 장점을 최대한 활용하려면 개방과 공유가 중요하므로 실행과정에 필요한

일련의 규칙에 합의해야하는 사회공동체의 공감대 형성이 필요

보건의료 분야에서는 블록체인 기술이 개인 건강정보 관리, 의료기기 및 약물의 추적, 임상시험

및 연구 데이터의 공유와 활용, 개인 의료정보 보호, 책임추적성 등 전반에 걸쳐 활용될 것으로

기대됨

특히 정보의 기밀성과 가용성은 상호 배타적인 근본적인 문제를 지니고 있었으나 블록체인은

정보 기밀성과 가용성 모두를 충족이 가능하므로 보건의료 분야의 변혁을 주도할 것으로

예상됨

Page 20: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

19

Ⅰ. 보건의료 빅데이터 동향

참고 자료

[1] 과학기술정책연구원, 블록체인 기술동향과 시사점, 2017

[2] 금융보안원, 블록체인 응용기술 개발 현황 및 산업별 도입 사례, 2017

[3] 한국보건산업진흥원, 헬스케어 산업에서의 블록체인 기술의 활용, 2017

[4] Deloitte, Blockchain:Opportunities for Health Care, 2016

[5] Gartner, Top 10 Strategic Technology Trends for 2018, 2017.10

[6] Gartner, Forecast: Blockchain Business Value, Worldwide, 2017-2030, 2017.10

[7] IBM, Making blockchain real for business explained, 2018.

[8] MIT, MedRec: Medical Data Management on the Blockchain,

https://viral.media.mit.edu/pub/medrec

[9] World Economic Forum, The future of financial infrastructure, 2016.8

[10] https://hitconsultant.net/2017/09/25/change-healthcare-enterprise-blockchain-

healthcare/

[11] http://blockchain-finance.com/

[12] http://www.itworld.co.kr/print/94202

Page 21: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

20

HIRA 빅데이터 브리프

Ⅰ-2. 보건의료 빅데이터 관련 주요 기사

“블록체인 변곡점에 대비하라”…앞선 기업들의 행보는 (CIO Korea, 2018. 6. 28.)

- 수많은 홍보와 열광에도 불구하고

블록체인은 아직 기업 분야에서 주류가

되지 못 했지만, IT 책임자들 사이에서

긍정적인 평가가 증가하고 있으며,

조만간 상황이 바뀔 전망

- 인권확보, 금융서비스, 곡물 추적,

물류분야 등 다양한 활용법 모색 중

기간ㆍ비용 줄이는 AI 신약개발...의료 빅데이터 개방이 관건 (한국경제, 2018. 6. 28.)

- ‘4차 산업혁명시대 바이오 신약 및

의료산업 전망과 과제’를 주제로

한경바이오헬스포럼 정책토론회(6. 27.)

개최

- AI를 활용한 신약개발, 빅데이터 활용성

제고, 규제방향 등에 대해서 각 분야

전문가들의 다양한 의견 발표

Page 22: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

21

Ⅰ. 보건의료 빅데이터 동향

4차위 ‘데이터산업 활성화 전략’ 의결…“통신ㆍ의료 개인맞춤형 서비스 가능해진다”

(전자신문, 2018. 6. 26.)

- 정부는 개인 정보 규제 완화와 동시에

2022년까지 선진국 대비 90% 수준

빅데이터 기술을 확보하고 강소기업

100개, 전문 인력 5만명을 육성해

데이터 시장을 10조원대로 육성할 계획

- 대통령 직속

4차산업혁명위원회(4차위)를 26일 이

같은 내용을 골자로 하는 ‘데이터 산업

활성화 전략’을 심의ㆍ의결함

- ‘데이터를 가장 안전하게 잘 쓰는 나라’를

비전으로 △데이터 이용제도 패러다임

전환 △데이터 가치사슬 혁신 △글로벌

데이터 산업 육성 기반 조성 등 3대 과제

수립

‘AI 의료’ 치고 나가는 일본…신기술 도입 판 깔아준다 (한국경제, 2018. 6. 28.)

- 니혼게이자이신문은 26일 “일본 정부가

AI를 활용한 의료기기에 대한 규정을

포괄적으로 정비하기로 했다”며 “AI

의료기기의 안전성과 유효성을 평가하는

지표가 올해 안에 마련될 예정”이라고

보도함

- 하토리 유타카 일본의사협회 이사는 “AI

의료기기의 유효성과 안전성을 하루 빨리

확보하는 것이 중요하다”고 밝힘

Page 23: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

22

HIRA 빅데이터 브리프

‘신기루’에서 ‘신세계’로…전세계는 ‘블록체인 2.0’ (머니투데이, 2018. 6. 23.)

- 지난해 실용성에 대한 의구심이 제기되던

블록체인이 세계 여러 산업에서 혁신

키워드로 떠오르고 있음

- 물류, 금융, 의료 등 활용 범위도 넓고,

마이크로소프트 등 주요 IT(정보기술)

기업들은 블록체인 활용을 뒷받침할

플랫폼 개발에 나서며 확산에 박차를

가하고 있음

의료 강국 싱가포르…원격진료 앱 82개국 환자가 활용 (중앙일보, 2018. 6. 9.)

- 최근 싱가포르에서는 스마트폰,

태블릿PC를 통해 진료를 예약하거나

온라인 원격 진료를 받는 경우가 늘고

있음

- 원격 진료 플랫폼인 '링엠디(RingMD)'를

통해 미국ㆍ영국ㆍ인도ㆍ태국 등 82개국

환자들이 진료를 예약하거나 원격진료를

받음

- 링엠디 창업자인 저스틴 퓰처는 “기술이

발전할수록 더 많은 의료 기록 데이터가

한데 집중적으로 모이게 될 것”이라며

“이 같은 변화는 결국 모든 사람들에게 더

정확한 진료와 정보를 제공하는 또 다른

의미의 민주화가 실현되는 과정”이라고

밝힘

Page 24: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료
Page 25: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

HIRA 빅데이터 분석 사례에서는

HIRA 빅데이터를 활용한 주요 이슈 분석, 연구 결과 등

다양한 활용 사례를 소개하고 있습니다.

ⅡHIRA

빅데이터

분석 사례

Page 26: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

25

Ⅱ. HIRA 빅데이터 분석 사례

Ⅱ-1. 국내 만성두드러기 유병률 및 치료 패턴 분석

연구책임자 연구실무자

예영민 이나미 이정동

아주대학교 의과대학 알레르기내과학교실

아주대학교 의과대학 알레르기내과학교실

아주대학교 의과대학의학통계 연구실

본 내용은 'Allergy Asthma Immunol Res. 2017 September;9(5):438-445.' 에 게재된 'Epidemiology of

Chronic Urticaria in Korea Using the Korean Health Insurance Database, 2010-2014'를 요약한 것임

1. 배경 및 목적

두드러기는 가려움증을 동반한 부종, 팽진, 혈관부종 등의 증상이 나타나며, 유병 기간과 유병

요인에 따라 구별됨

급성 두드러기는 알레르겐, 식품, 약물, 식품 첨가물 및 감염에 의해 유발되며, 6주 이내에

소실됨

만성 두드러기는 대부분 외부 요인이 확인되지 않으며, 적어도 6주 이상 피부 가려움 및 팽진이

지속됨

만성 두드러기의 지속 기간은 환자마다 큰 차이가 있지만, 평균 5 ~ 8년의 유병 기간을 보고함

생명을 위협하는 질환은 아니지만 긴 지속 기간, 갑작스러운 발생, 참기 어려운 가려움증, 외모

변화 등에 의해 삶의 질 저하를 초래함

북미 및 유럽 인구에서의 만성 두드러기 유병률은 0.5% ~ 1.0%로 보고된 바 있지만 아시아

인구에서는 유병률 및 발생률, 약물 치료 현황, 사회적 부담 등에 대한 지식이 여전히 부족함

본 연구에서는 건강보험심사평가원(HIRA)의 데이터를 이용하여 국내 만성두드러기의 유병률 및

치료 패턴을 확인하고자 함

Page 27: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

26

HIRA 빅데이터 브리프

2. 연구 방법

자료원: 2010 ~ 2014년 건강보험 청구자료, 통계청 인구자료(2012년)

대상: 연구기간 동안 주진단명 L50(두드러기)으로 진단받은 환자

분석방법: 항히스타민제 처방일수(42일 이상) 등의 조건에 따라 만성 두드러기 환자를 정의하고,

만성 두드러기 환자들의 유병률, 치료패턴, 동반 질환을 분석함

조유병률 및 연령 표준화 유병률은 poisson regression을 이용하여 분석하고 인년(person-

year)* 및 95% 신뢰 구간으로 기술함

* 인년(person-year): 대상의 관찰기간이 서로 다를 때 사용하며, 해당 기간 동안 대상자의 관찰기간의

합임. 1인년은 1명을 1년간 관찰한 값임

3. 분석 결과

2010년 ~ 2014년간 두드러기 케이스는 14,096,710건이었으며, 이 중 조작적 정의에 따른 만성

두드러기 케이스는 5,599,940건(39.7%) 임

전체 두드러기 환자 중 만성 두드러기 환자의 연간 비율은 5년간 평균 23.5% 임

만성 두드러기 유병률은 100,000인년당 2,256.5명(95% CI, 2,252.3 - 2,260.6)이며, 연간

유병률은 2010년 100,000명당 1,662.3명에서 2014년 100,000명당 2,310.8명으로 꾸준히

증가함

5년간 연령 조정된 만성 두드러기 유병률은 전체 인구 100,000인년당 2,138.4명(2,134.3

- 2,142.4)이며, 남성은 100,000인년당 1,819.2명 (1,813.9 - 1,824.6), 여성은

100,000인녕당 2419.8명(2,460.7 - 2,472.9)임

Page 28: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

27

Ⅱ. HIRA 빅데이터 분석 사례

[그림 1] Crude prevalence of CU (per 100,000 person-years) over a 5-year period. There

was a significant linear trend in the crude prevalence of CU

over the 5-year period (P<0.001). CU, chronic urticaria.

만성 두드러기의 연령별 유병률은 65세 이상에서 가장 높았으며, 10-29세에서 가장 낮게 나타남

10세 미만에서는 남성, 청소년 및 15세 이상 성인에서는 여성의 비율이 유의하게 높음

[그림 2] The prevalence of CU (per 100,000 person-years) specific to age and sex. CU,

chronic urticaria

Page 29: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

28

HIRA 빅데이터 브리프

만성두드러기 환자의 평균 연령은 41.6 ± 23.2세였고, 평균 6.7회 병원을 방문했으며, 평균

45.0일 동안 처방을 받았음

두드러기 유병기간의 중간 값은 591일이었으며, 처방약품 사용기간은 3개월 미만 12.0%, 3

~ 12개월 26.2%, 12 ~ 24개월 23.0%, 24 ~ 36개월 17.7%, 36 ~ 48개월 13.4%, 48개월

이상 7.8% 임

[그림 3] Distribution of CU patients according to urticaria duration. M, month;

CU, chronic urticarial

만성 두드러기 환자 중 27.2%가 항히스타민제만을 처방받았고, 69.9%는 항히스타민제 및

스테로이드를 함께 처방받음

항히스타민제를 처방받은 환자 중 49.7%는 진정성 1세대 항히스타민제를, 69.7%는 비진정성

2세대 항히스타민제를 처방받음

스테로이드제 처방일수는 주사제의 경우 3.2 ± 5.6일, 경구 스테로이드의 경우 17.7 ±

42.3일임. 반면 cyclosporine은 만성 두드러기 환자의 0.02%에서만 처방되었으며, 평균

처방일수는 5년 동안 66.7 ± 105.3일이었음

Page 30: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

29

Ⅱ. HIRA 빅데이터 분석 사례

만성 두드러기 환자에서 흔한 동반질환은 위장병(62.8%), 알레르기비염(32.4%) 및

감기(26.9%)임

연령별로 보면 30세 이상에서는 위장관 질환(30-64세 68.9%, 65세 이상 71.9%), 5세 미만

소아에서는 알레르기 비염(50.1%)과 감기(60.0%)가 흔하게 동반됨

[표 1] Age-specific comorbidities of patients with chronic urticaria

4. 결론

연구기간(2010 ~ 2014년)동안 만성 두드러기는 인구 100,000인년당 2,138.4(95% CI,

2,134.3-2,142.4)명의 연령 조정 유병률이 추정됨

만성 두드러기의 연간 유병률은 해마다 증가하고 있으며, 전체 두드러기 환자 중 만성 두드러기

환자의 비율은 5년간 평균 23.5%임

연령별 유병률은 10세 이하의 소아와 65세 이상 노인에서 높았고, 여성 유병률은 15세 이상의

환자에서만 남성에 비해 높았음

만성 두드러기 평균 치료기간은 1.6년으로 이전 연구결과와 유사했으며, 60% 이상의 환자가 1년

이상의 치료를 요함

Page 31: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

30

HIRA 빅데이터 브리프

치료패턴에서는 항히스타민제 단독치료를 받는 환자가 30% 미만이었으며, 70%의 환자는

항히스타민제와 전신스테로이드를 함께 처방받았음

항히스타민제 중 진정성 1세대 항히스타민제를 처방받은 환자가 50%에 달하여, 스테로이드제

및 1세대 항히스타민제의 사용을 삼가하는 만성두드러기 진료지침의 권고사항이 잘 지켜지지

않는 것으로 판단됨

항히스타민제 단독으로 치료되지 않는 난치성 만성 두드러기 환자를 위한 새로운 치료전략이

필요하며, 스테로이드제 및 1세대 항히스타민제의 사용을 줄일 수 있도록 교육이 필요함

Page 32: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

31

Ⅱ. HIRA 빅데이터 분석 사례

Ⅱ-2. 흉추부 황색인대 골화증 유병률 및 관련 요인 분석

연구책임자 연구실무자

김영훈 김상일

가톨릭대학교 의과대학 서울성모병원 정형외과 가톨릭대학교 의과대학 서울성모병원 정형외과

본 내용은 'The Spine Journal 18 (2018) 551-557' 에 게재된 'Prevalence and related clinical factors of

thoracic ossification of the ligamentum flavum-a computed tomography-based cross-sectional

study'를 요약한 것임

1. 배경 및 목적

황색인대 골화증은 황색인대 내에서 이소성 골화가 발생하는 질환으로 흉추부에서 흔한 것으로

알려져 있으며, 흉추 척수를 압박하여 신경학적 증상을 유발할 수 있어 흉추척수증 원인 중

하나임

1920년 Polgar가 최초로 보고한 이후 일본에서 많은 연구가 진행되었으며, 극동아시아인(한국,

일본, 중국 등)에서의 흉추척수증의 주요 원인으로 알려져 있음

여러 가지 관련 요소가 제시되고 있지만 아직 명확한 원인은 밝혀지지 않음

황색인대 골화증의 유병률은 3.8% ~ 63.9%로 매우 다양하며, 검사 방법에 따라 결과도 매우

상이함

유병률에 대한 대부분의 보고는 일본에서 이루어졌으며, 한국인을 대상으로 한 대단위 연구는

MRI를 이용하여 발표된 연구가 있지만 골성 병변의 특성상 가장 정확하다고 할 수 있는

컴퓨터단층촬영(CT)을 이용한 연구는 없음

본 연구에서는 특정 기관의 CT자료를 통해 한국인에서의 흉추부 황색인대 골화증의 유병률을

알아보고, 더불어 건강보험심사평가원 데이터를 활용하여 흉추부 황색인대 골화증이 증상을

유발하는 비율을 가늠해보고자 함

Page 33: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

32

HIRA 빅데이터 브리프

2. 분석 방법

자료원: 2014년 건강보험 청구자료 및 특정 의료기관(저자 소속)

대상: 흉추부 인대 골화증 코드로 진단받은 환자

분석방법: 특정 의료기관(저자 소속기관)에서 흉추 CT를 시행받은 환자들을 대상으로 흉추부

황색인대 골화증 유무, 크기, 위치를 조사하고, 전국 자료를 활용하여 유병률 및 수술적 치료

비율을 분석함

3. 분석 결과

특정 의료기관의 CT 촬영에서 나타난 흉추부 황색인대 골화증의 유병률은 21.8%였으며, 남성은

23%, 여성은 20.1%였음

CT 촬영을 받은 환자 4,999명 중 1,090명(남성 674명, 여성 416명)의 흉추부 황색인대

골화증 환자가 발견됨

흉추부 황색인대 골화증 환자의 평균 연령은 60.9(14.3)세(95% CI, 60.0-61.7)이며, 남성은

62.0(13.9)세, 여성은 59.1(14.9)세 였음

1,090명의 흉추부 황색인대 골화증 환자 중 592명이 단일 흉부 수준의 병변을 보였고,

498명은 다중 병변을 보임

Page 34: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

33

Ⅱ. HIRA 빅데이터 분석 사례

흉추부 황색인대 골화증 요인에 대한 단변량 회귀 분석 결과, 성별, 흉추후만(TK), 당뇨병(DM),

후종인대 골화증(OPLL)이 유의하게 나타났으며, 다변량 회귀 분석 결과 모든 요인이 유의하였음

하지만 횡단면 연구의 성격에 따라 흉추부 황색인대 골화증과의 인과 관계가 불분명하기

때문에 당뇨병과 후종인대 골화증이 위험인자 인지의 여부를 판단하기 어려움

Page 35: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

34

HIRA 빅데이터 브리프

요인에 대한 통계적 유의성은 별도 로지스틱 회귀 분석에서 성별에 따라 다르게 확인되었으며,

흉추후만과 후종인대 골화증은 남ㆍ녀 모두에서 유의적이었지만 당뇨병과 연령은 여성에서만

유의함

연구분석 기간 내에 흉추부 인대 골화증의 상병코드로 수진이력이 있는 환자를 분석한 빅데이터

결과, 기간 유병률은 인구 10,000명당 3명이었고, 남성 10,000명당 2명, 여성 10,000명당

4명으로 나타남

해당 상병으로 수술적 치료를 받은 환자는 인구 1,000,000명당 95명이며, 남성

1,000,000명당 7명, 여성 1,000,000명당 120명 임

4. 결론

특정 의료기관의 자료(CT 촬영)를 바탕으로 한 흉추부 황색인대 골화증의 유병률은 21.8%로

이전 문헌과 비교하였을 때, 비교적 높게 나타남

하지만 흉추부 인대 골화증으로 수진 이력이 있는 환자들의 기간 유병률은 그보다 훨씬 낮은 인구

10,000명당 3명(0.03%)으로 이를 통해 흉추부 황색인대 골화증이 실제 임상증상으로 발현되는

경우는 매우 적다고 생각할 수 있음

분석 기간 내에 흉추부 인대 골화증으로 수술을 받은 환자는 인구 1,000,000명당 95명이었는데,

신경학적 증상이 발생한 흉추부 황색인대 골화증은 일반적으로 수술적 치료가 조기에 시행되기

때문에 이 수치로 새롭게 진단된 환자라고 가정할 수 있음

Page 36: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

35

Ⅱ. HIRA 빅데이터 분석 사례

Ⅱ-3. 소아암 진단의 계절적 추세 및 바이러스 감염 경향

연구책임자 연구실무자

김혜리 심규석

중앙대학교 소아청소년과울산대학교 의과대학 서울아산병원 소아청소년과

중앙대학교병원 소아청소년과

본 내용은 'Cancer Epidemiology 51 (2017) 118-124' 에 게재된 'Seasonal trends of diagnosis of childhood

malignant diseases and viral prevalence in South Korea'를 요약한 것임

1. 배경 및 목적

소아암은 소아에게 발생하는 악성 종양을 뜻하며, 성인과는 달리 백혈병, 뇌종양, 악성림프종

등의 발생 비율이 높음

소아암은 20세 미만에서 가장 흔하게 발생하는 질병과 관련된 사망 원인이며, 매년 10만명당

16.6명이 진단되고 있음

소아암은 정확한 원인이 밝혀진 바는 없지만 감염과 관련이 있다는 가설이 제시되었음

특히 전구체 B 세포 급성 림프 구성 백혈병, 림프종의 몇가지 아형, 비인강암은 바이러스 감염과

관련이 있는 것으로 알려짐

일부 연구에서 소아암 진단에 계절 영향이 있는 것으로 보고되었으며, 이에 따라 감염 등 계절

요인이 있을 것으로 여겨짐

본 연구는 건강보험심사평가원(HIRA)의 데이터를 이용하여 소아암의 진단 패턴을 분석하고 이

패턴과 계절성 바이러스 감염 경향을 비교하고자 함

Page 37: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

36

HIRA 빅데이터 브리프

2. 연구 방법

건강보험심사평가원에서 제공하고 있는 서비스를 이용하여 2009년 9월~2013년 12월까지의

소아암 환자 데이터를 추출

대상은 20세 미만의 소아암 및 면역억제치료를 필요로 하는 만성 혈액질환 환자이며, ICD-10

코드에 따라 암종별, 월별로 정리함

병원체 정보는 질병관리본부에서 공개 게시하는 급성감염증병원체감시자료를 이용하였으며,

동일한 기간 내의 호흡기 바이러스 9종 및 급성 설사 바이러스 4종, 세균 7종의 검출률 자료를

이용함

[표 3] International Classification of Diseases 10 for childhood cancer,

aplastic anemia and myelodysplastic syndrome

Disease classification ICD 10 codes

Aplastic anemia D61.0~D61.9

Acute lymphoblastic leukemia C91.0, C91.3, C91.6, C91.7, C91.9

Acute myeloid leukemia C92.0, C92.4~C93.0, C94.2

Bone tumor C40.0, C41.0~C41.4, C41.8, C41.9

Chronic myeloid leukemia C92.1~C92.2

Chronic myelomonocytic leukemia C93.1

Central nervous system tumor C70.0, C70.1, C70.9, C71.0~C71.9, C72.0~C72.9

Germ cell tumor C56.0, C56.1, C56.9, C57.0, C57.3, C57.4, C57.7~C58.0, C60.0~

Hepatoblastoma C22.2

Hepatocellular carcinoma C22.0

Hodgkin’s lymphoma C81.0, C81.1, C81.2, C81.3, C81.4, C81.7, C91.9

Juvenile myelomonocytic leukemia C93.3

Myelodysplastic syndrome C94.6, D46.0~D46.9

Myelofibrosis/Myeloproliferative neoplasm C94.5

Neuroblastoma C74

Non-Hodgkin lymphoma C82, C83, C84, C85, C86, C88.4

Nasopharyngeal carcinoma C11

Retinoblastoma C69.1, C69.2, C69.3, C69.4, C69.6, C69.9

Renal tumor C64, C64.0, C64.1, C64.9

Sarcoma C49

ICD, International Classification of Diseases.

Page 38: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

37

Ⅱ. HIRA 빅데이터 분석 사례

3. 연구 결과

연구 기간 동안 소아암으로 진단받은 환자는 9,085명이며, 월 평균 175건의 새로운 진단건수가

발생하였음

연간 월별 누적 횟수는 1월이 평균 236건으로 가장 높고, 9월이 평균 120건으로 가장 낮음

질환별, 계절별로 소아암 진단 경향을 분석하면 겨울에는 급성 골수성 백혈병, 신경모세포종 및

호지킨 림프종이 다른 계절보다 많이 발생함

Page 39: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

38

HIRA 빅데이터 브리프

[표 3] Seasonal difference analysis in newly diagnosed childhood malignancy

by disease category

Season(months)

Spring(3, 4, 5)

Summer(6, 7, 8)

Autumn(9, 10, 11)

Winter(12, 1, 2)

P

AA 16.58 ± 4.25 19.00 ± 7.11 12.87 ± 8.31 19.69 ± 6.06 0.759

ALL 22.33 ± 5.37 20.42 ± 6.72 21.87 ± 11.72 28.54 ± 7.83 0.071

AML 9.58 ± 2.50 8.50 ± 3.26 9.67 ± 4.22 13.62 ± 2.99 0.004

BT 14.83 ± 3.66 14.83 ± 4.53 13.40 ± 8.10 18.38 ± 4.68 0.221

CML 2.00 [0.50;2.50] 3.00 [2.00;3.50] 2.00 [1.00;2.00] 3.00 [2.00;3.00] 0.108

CNS 35.42 ± 5.76 34.75 ± 10.06 29.73 ± 16.39 42.92 ± 13.76 0.305

GCT 17.08 ± 3.00 20.25 ± 6.31 11.67 ± 6.63 22.92 ± 6.16 0.359

HBL 2.50 [1.50;4.00] 2.50 [1.00;3.50] 3.00 [1.00;4.00] 1.00 [1.00;3.00] 0.77

HL 3.00 [1.50;5.00] 3.50 [2.00;5.00] 2.00 [1.00;2.50] 4.00 [3.00;5.00] 0.013

MDS 3.50 [1.50;5.00] 4.00 [3.00;4.00] 2.00 [1.00;3.00] 3.00 [2.00;5.00] 0.321

NBL 4.00 [2.50;5.50] 4.50 [3.00;6.50] 5.00 [3.50;5.00] 7.00 [6.00;8.00] 0.012

NHL 19.83 ± 4.78 21.25 ± 5.40 13.07 ± 6.97 22.54 ± 3.93 0.945

NPca 1.00 [1.00;2.00] 1.00 [0.00;1.50] 1.00 [0.00;1.00] 2.00 [1.00;2.00] 0.198

RBL 4.67 ± 2.06 4.58 ± 2.15 4.67 ± 3.83 7.00 ± 3.27 0.069

RT 4.58 ± 2.43 4.42 ± 2.78 4.07 ± 2.63 6.69 ± 3.66 0.12

Sar 6.58 ± 2.39 7.50 ± 3.97 6.20 ± 4.02 9.31 ± 3.61 0.149

SUM 169.42 ± 21.22 175.83 ± 39.42 142.27 ± 68.07 216.00 ± 35.97 0.119

AA, aplastic anemia; ALL, acute lymphoblastic leukemia; AML, acute myeloid leukemia; BT, bone tumor; CML,

chronic myeloid leukemia; CNS, central nervous system tumors; GCT, germ cell tumor; HBL, hepatoblastoma; HL,

Hodgkin’s lymphoma; MDS, myelodysplastic syndrome; NBL, neuroblastoma; NHL, Non-Hodgkin’s lymphoma;

NPca, nasopharyngeal cancer; RBL, retinoblastoma; RT, renal tumor; Sar, sarcoma; SUM, summation of all cases.

호흡기 바이러스 가운데 인간 파라인플루엔자 바이러스 유병률은 1 ~ 2개월 후 소아암 진단

데이터와 관련이 있는 것으로 나타남

특정 바이러스의 유행이 암 진단에 영향을 미친다면 해당 바이러스의 유병률은 암 진단 피크

시기 전에 증가할 것으로 판단되므로 소아암 진단 데이터와 1 ~ 2개월 전 바이러스 검출률

데이터에 대해 Granger 인과 관계 분석을 시행함

분석된 호흡기 바이러스 가운데 인간 파라인플루엔자 바이러스(HPIV)의 유병률은 1개월 후

9개 질환 및 총(sum)데이터와, 2개월 후 6개 질환 및 총(sum)데이터와 관련이 있는 것으로

나타남

Page 40: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

39

Ⅱ. HIRA 빅데이터 분석 사례

A. Virus data & Diagnostic data after 1 month

Ds.

VirusAA ALL AML BT CML CNS GCT HBL HL MDS NBL NHL NPca RBL RT Sar SUM

HAdV 0.735 0.203 0.791 0.052 0.847 0.423 0.251 0.201 0.125 0.912 0.602 0.029 0.020 0.316 0.112 0.907 0.243

HPIV 0.066 0.001 0.001 0.002 0.548 0.017 0.041 0.246 0.078 0.065 0.081 0.021 0.012 0.014 0.061 0.012 0.001

HRSV 0.570 0.083 0.011 0.327 0.486 0.286 0.355 0.706 0.025 0.812 0.017 0.102 0.208 0.528 0.928 0.515 0.070

IFV 0.244 0.617 0.449 0.785 0.440 0.546 0.810 0.696 0.439 0.745 0.494 0.585 0.649 0.532 0.651 0.672 0.633

HCoV 0.095 0.049 0.267 0.124 0.858 0.541 0.079 0.875 0.075 0.395 0.373 0.054 0.041 0.062 0.629 0.327 0.115

HRV 0.627 0.976 0.962 0.389 0.591 0.896 0.665 0.856 0.449 0.279 0.749 0.916 0.190 0.508 0.062 0.528 0.933

HBoV 0.102 0.073 0.098 0.613 0.366 0.890 0.428 0.905 0.945 0.557 0.480 0.790 0.280 0.280 0.475 0.298 0.809

Rota 0.425 0.832 0.419 0.885 0.947 0.905 0.655 0.572 0.595 0.939 0.136 0.442 0.422 0.869 0.858 0.284 0.931

Norovirus 0.006 0.949 0.078 0.184 0.118 0.904 0.244 0.995 0.371 0.101 0.061 0.197 0.183 0.041 0.703 0.446 0.223

EntericAdenovirus

0.996 0.172 0.620 0.970 0.992 0.889 0.492 0.127 0.828 0.501 0.831 0.468 0.762 0.256 0.766 0.521 0.803

Astrovirus 0.070 0.496 0.028 0.141 0.630 0.551 0.241 0.613 0.055 0.398 0.042 0.104 0.071 0.489 0.191 0.009 0.129

B. Virus data & Diagnostic data after 2 months

Ds.

VirusAA ALL AML BT CML CNS GCT HBL HL MDS NBL NHL NPca RBL RT Sar SUM

HAdV 0.486 0.350 0.667 0.114 0.405 0.788 0.434 0.392 0.210 0.801 0.327 0.065 0.064 0.414 0.637 0.758 0.353

HPIV 0.186 0.002 0.003 0.006 0.774 0.041 0.118 0.634 0.216 0.135 0.104 0.045 0.059 0.034 0.268 0.050 0.002

HRSV 0.040 0.230 0.029 0.526 0.830 0.403 0.258 0.807 0.114 0.619 0.073 0.235 0.301 0.787 0.428 0.079 0.357

IFV 0.577 0.847 0.540 0.843 0.502 0.609 0.701 0.679 0.754 0.602 0.571 0.304 0.964 0.643 0.428 0.868 0.752

HCoV 0.334 0.070 0.411 0.261 0.632 0.643 0.185 0.893 0.169 0.335 0.050 0.121 0.238 0.013 0.480 0.338 0.120

HRV 0.633 0.297 0.810 0.618 0.830 0.467 0.252 0.998 0.558 0.209 0.699 0.213 0.506 0.171 0.592 0.511 0.111

HBoV 0.057 0.020 0.095 0.436 0.517 0.184 0.186 0.955 0.102 0.383 0.464 0.194 0.516 0.177 0.448 0.197 0.087

Rota 0.465 0.308 0.462 0.938 0.868 0.905 0.366 0.813 0.752 0.822 0.102 0.229 0.560 0.467 0.834 0.592 0.760

Norovirus 0.081 0.187 0.135 0.322 0.323 0.691 0.768 0.712 0.514 0.264 0.097 0.196 0.267 0.085 0.908 0.628 0.450

Enteric 

Adenovirus0.945 0.370 0.032 0.329 0.936 0.820 0.868 0.105 0.745 0.571 0.040 0.930 0.919 0.527 0.920 0.412 0.836

Astrovirus 0.079 0.727 0.097 0.334 0.318 0.301 0.613 0.661 0.020 0.734 0.090 0.253 0.186 0.741 0.379 0.035 0.242

AA, aplastic anemia; ALL, acute lymphoblastic leukemia; AML, acute myeloid leukemia; BT, bone tumor; CML,

chronic myeloid leukemia; CNS, central nervous system tumors; Ds., disease; GCT, germ cell tumor; HBL,

hepatoblastoma; HL, Hodgkin’s lymphoma; MDS, myelodysplastic syndrome; NBL, neuroblastoma; NHL, Non-

Hodgkin’s lymphoma; NPca, nasopharyngeal cancer; RBL, retinoblastoma; RT, renal tumor; Sar, sarcoma; Sum,

summation of all cases P-values < 0.05 were considered as indicating causality

Page 41: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

40

HIRA 빅데이터 브리프

4. 결론

연구 결과 국내 소아암 진단은 연중 경향이 있으며, 12~1월 최대, 9~10월에 최소 환자수를 보임

이는 바이러스 등의 연중 유행을 보이는 인자가 소아암 발생에 영향을 줄 가능성이 있는 것으로

볼 수 있음

인간 파라인플루엔자 바이러스는 유행 1~2개월 후 소아암 진단에 영향을 주는 것으로 나타남

향후 장기간의 다각적인 역학 자료 분석을 통해 소아암 발생 원인 인자에 대한 접근이 가능할

것으로 기대됨

Page 42: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료
Page 43: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

HIRA 빅데이터 분석 가이드는

HIRA 빅데이터 이용방법과 구조 등을 소개하고,

대표적인 분석 방법을 안내하여 연구자들이 HIRA 빅데이터를

보다 쉽게 활용할 수 있도록 지원합니다.

ⅢHIRA

빅데이터

분석 가이드

Page 44: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

43

Ⅲ. HIRA 빅데이터 분석 가이드

Ⅲ-1. 'HIRA 빅데이터 분석 가이드' 란?

본 분석가이드는 건강보험심사평가원의 데이터를 활용을 원하는 연구자들에게 도움이 되고자

작성되었습니다. 심평원 데이터를 처음 접하거나, 익숙치 않은 분들도 연구에 자유롭게 활용할 수

있도록 자세하고 쉽게 설명하고자 합니다.

이번 호에서는 동반질환 분석에 대한 설명을 담고 있으며, 다음 호에서는 대조군 설정에 대해

소개할 예정입니다.

[표 1] HIRA 빅데이터 분석 가이드 계획(2018년)

호 주 제

2018년 1분기 (제2권 1호) HIRA 보건의료 빅데이터 소개

2018년 2분기 (제2권 2호) 입원 에피소드 구축

2018년 3분기 (제2권 3호) 동반질환 분석

2018년 4분기 (제2권 4호) 대조군 설정

Page 45: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

44

HIRA 빅데이터 브리프

Ⅲ-2. HIRA 빅데이터 분석 - 동반질환 분석※ 출처: 건강보험 청구자료 분석 매뉴얼(2017, 건강보험심사평가원)

1. 동반질환의 정의

동반질환(Comorbidity)은 환자가 가지고 있는 질환 중 주진단 질환이 아닌 나머지 질환을 뜻함

합병증의 개념과 비슷하지만 주진단 질환과 관련이 없다는 점에서 차이가 있음

환자에 따라 여러 가지 동반질환을 가지고 있을 수 있음

건강보험 청구자료를 활용한 연구에서는 객관적인 인과성 추론을 위하여 중증도 보정 과정을

거치는데 동반질환은 중증도 보정 시 중요한 변수임

중증도 보정은 환자 결과에 영향을 줄 수 있는 교란변수들을 통제하는 과정으로 연령, 성별,

의료보장형태, 응급실 방문 등의 변수를 활용함

동반질환은 주진단 질환과 관련은 없으나 합병증, 사망, 재원일수, 진료비 등에 영향을 준다는

점에서 중요한 중증도 변수임

예를 들어 동일한 질환, 동일한 치료를 받은 환자임에도 연령, 성별, 동반질환 유무 등에 따라

환자의 결과는 차이가 있을 수 있으므로, 중증도 보정을 통해 동일한 조건으로 보정이 필요함

Page 46: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

45

Ⅲ. HIRA 빅데이터 분석 가이드

2. 동반질환 구축 과정

2.1 동반질환 측정 도구

동반질환 보정 방법에는 기존 발표된 연구 결과를 근거로 임상적 견해 혹은 통계적 검정 결과에

따라 유의한 질환만을 선택적으로 보정하는 방법(ad hoc selection)과 동반질환 측정도구를

사용하는 방법이 있음

선택적 보정 방법은 동반질환에 대한 서로 다른 견해 또는 통계적 접근 방법으로 연구들 간의

비교가능성이 낮다는 제한점이 있음

동반질환을 종합적으로 평가하고, 다양한 질환에 적용할 수 있는 Charlson 동반질환 지수

(Charlson comorbidity index, CCI)1)와 Elixhauser의 동반질환 (Elixhauser's comorbidity

measure, ECM)2) 등이 주로 활용됨

1) Charlson 동반질환 지수(CCI)

CCI는 동반질환의 중증도가 반영되어 있다는 점에서 행정자료를 자료원으로 하는 연구에서 널리

사용되는 측정도구임

Charlson 등은 1984년 1개월 동안 뉴욕병원에 입원한 604명 환자의 의무기록을 토대로

1년 사망을 잘 예측하는 19개 질환을 선정함. 그리고 각 질환별 상대위험도를 근거로 1, 2, 3,

6점의 가중치를 부여하였고, 이 가중치의 합이 CCI에 해당됨

[그림 1] Charlson 동반질환 지수 산출 방법

1) Charlson ME, et al. A new method of classifying prognostic comorbidity in longitudinal studies

development and validation. J Chron Dis 1987;40(5):373-383.

2) Elixhauser A, et al. Comorbidity measures for use with administrative data. Med Care 1998;36(1):8-27.

Page 47: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

46

HIRA 빅데이터 브리프

의무기록자료를 토대로 개발된 CCI를 행정자료에 적용하기 위하여 ICD-9 혹은 ICD-10 코드로

전환함

CCI를 개발할 당시에는 19개의 동반질환이 선정되었으나, Deyo 등3)이 ICD-9 코드로

전환하면서 백혈병과 림프종을 비전이형 고형암에 포함시켜 17개 질환으로 축소됨. 그 뒤

Quan 등(2005)4)은 Deyo의 알고리즘을 토대로 ICD-10 코드로 전환하여 최종적으로 17개

질환으로 구성됨

[그림 2] Charlson 동반질환과 가중치(Quan 등, 2005)

CCI는 일반적으로 0점, 1점, 2점, 3점 이상으로 구분하여 범주형 변수로 사용되나, CCI 분포에

따라 범주를 구분하여 사용할 수 있음(예: 0점, 1점, 2점 이상)

3) Deyo RA, et al. Adapting a clinical comorbidity index for use with ICD-9-CM administrative

databases. J Clin Epidemiol 1992;45(6):613-619.

4) Quan H, et al. Coding algorithms for defining comorbidities in ICD-9-CM and ICD-10 administrative

data. Med Care 2005;43(11):1130-1139.

Page 48: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

47

Ⅲ. HIRA 빅데이터 분석 가이드

2) Elixhauser 동반질환(ECM)

Elixhauser 등은 행정자료를 사용하여 재원기간, 진료비, 병원 내 사망 등을 잘 예측하는 30개

동반질환을 선정하고, 각 질환별로 ICD-9 코드를 제시함

30개 동반질환은 합병증을 동반한 고혈압과 동반하지 않는 고혈압을 통합한 개수로, 이를

분리하면 31개 질환임

ECM은 CCI처럼 하나의 지수로 환산하지 않고, 각각의 동반질환을 이분형(binary) 형태로

사용되나, CCI와 같이 하나의 점수로 환산하는 연구들이 보고됨

Dominick 등5)은 30개 질환에 각각 1점을 부여한 후 합산하는 방법을 제시하였고, van

Walraven 등6)은 병원 내 사망을 예측하는 다중 로지스틱 회귀모형에서 얻은 회귀계수를

사용하여 점수 시스템을 개발함

ECM에는 CCI와 비교하여 다양한 정신질환(알코올, 약물 남용 등)이 포함되어 있으며, 비만과

체중 감소와 같이 건강보험 청구자료에는 과소입력될 가능성이 있는 질환이 포함되어 있음

5) Dominick KL, et al. Comparison of three comorbidity measures for predicting health service use in

patients with osteoarthritis. Arthritis Rheum 2005:53(5);666-672.

6) van Walraven, et al. A modification of the Elixhauser comorbidity measures into a point system for

hospital death using administrative data. Med Care 2009;47(6):626-633.

Page 49: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

48

HIRA 빅데이터 브리프

[그림 3] Elixhauser의 동반질환과 가중치(Quan 등, 2005)

2.2 동반질환 관찰기간(look back period) 결정

동반질환 관찰기간은 환자의 이전 의료이용을 추적하는 기간을 의미하며, 이는 동반질환

유병률과 모형 예측력에 영향을 줌

관찰기간이 길어질수록 동반질환을 관찰할 기회는 증가하지만, 동반질환 보정 효과가 감소하여

비용-효과적이지 않다고 보고됨

건강보험 청구자료에는 환자 고유 식별자가 포함되어 있어 자료 접근 범위 내에서 장기간 추적이

가능하지만, 대부분의 연구에서는 자료 접근성과 임상적 판단을 고려하여 기준 일자(index

date)를 기준으로 이전 1년 정도를 동반질환 관찰기간으로 설정함

Page 50: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

49

Ⅲ. HIRA 빅데이터 분석 가이드

건강보험 청구자료만으로는 입원 중에 발생한 질환인지의 여부를 구분할 수 없기 때문에 기준

시점에 입력된 상병을 제외한 이전에 기록된 상병만을 관찰할 것을 제안함

2.3 자료 범위 결정

동반질환 분석 시 결정해야 하는 자료의 범위는 크게 의료 이용과 상병임

의료 이용은 입원과 외래 진료를 뜻하며, 분석 질환 등에 따라 모두 사용하거나 한쪽을 선택하여

사용함

상병의 범위는 ⅰ) 주상병, ⅱ) 주상병과 제1부상병, ⅲ) 모든 상병으로 구분할 수 있으며,

연구자의 판단에 따름

건강보험 청구자료를 사용한 분석에서는 입원과 외래 자료를 모두 사용하여 동반질환을 관찰함

비교적 진단의 정확성이 높은 입원자료만을 사용하여 동반질환을 관찰할 수 있으나, 당뇨와

고혈압과 같은 외래 중심 질환을 관찰하지 못한다는 제한점이 있음

주상병은 진료기간 중 최종적으로 환자가 진단받은 병태로서 치료나 검사에 대한 요구가 가장

큰 병태이며, 부상병은 진료기간 중 주상병과 함께 있었거나, 진료기간 중 발생되어 환자 진료에

영향을 준 병태를 의미함

배제 상병은 병태가 의심되어 검사 등을 수행하였으나 최종 진단을 받지 않은 경우에

해당되므로, 제외하고 동반질환을 구축함

Page 51: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

50

HIRA 빅데이터 브리프

3. 동반질환 분석(CCI) 예시

환자 기준 시점(index date)을 기준으로 과거 1년 동안 동반질환을 관찰하여 CCI를 산출하는

프로그램을 제시

동반질환을 합병증과 구분하기 위하여 기준 시점에 청구된 상병명을 CCI에 포함하지 않고,

Quan 등(2005)이 제시한 ICD-10 알고리즘과 Original 가중치를 적용함

주상병과 제1부상병만(200테이블)을 관찰하는 경우, 모든 상병(400테이블)을 관찰하는 경우로

구분하여 프로그램을 제시함

/*[1단계] 환자의 기준 시점(index date) 설정: 가장 처음 진료받은 건 기준*/

환자 고유 식별자(pat_hpin), 요양개시일자(recu_fr_dd), 요양종료일자(recu_to_dd)를 기준으로 정렬하고, 첫

번째 자료를 기준으로 설정*/

proc sort data=temp; by pat_hpin recu_fr_dd recu_to_dd; run;data index(keep=pat_hpin index_start_date index_end_date); set temp; by pat_hpin; format index_start_date index_end_date yymmdd10.;index_start_date = input(recu_fr_dd, yymmdd8.);index_end_date = input(recu_to_dd, yymmdd8.);if first.pat_hpin=1 then output; run;

/*[2단계] Chalrlson 동반질환 해당 여부 코딩을 위한 DATA 변환*/

/* 200테이블의 주진단과 제1부진단만 사용하는 경우(st200) → DATA를 400테이블 형태로 변경*/

data temp1; set st200;sick_cd=msick_cd; output;sick_cd=ssick_cd; output; run;data temp2; set temp1; if sick_cd=' ' or sick_cd='$' then delete; keep pat_hpin recu_fr_dd recu_to_dd sick_cd spjkey; run;

※ DATA형태 전환

[전] wide form [후] long form

pat_hpin

msick_cd

ssick_cd

recu_fr _dd

recu_to _dd

pat_hpin

sick _cd

recu_fr _dd

recu_to _dd

1 I20 I21 20160101 20160112 → 1 I20 20160101 201601122 I22 20160108 20160201 1 I21 20160101 20160112

2 I22 20160108 20160201

/* 400테이블의 상병명을 사용하는 경우(st400) → 배제진단만 제외*/

data temp2; set st400; if sick_div_ty_cd='3' then delete; keep pat_hpin recu_fr_dd recu_to_dd sick_cd spjkey2; run;

Page 52: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

51

Ⅲ. HIRA 빅데이터 분석 가이드

/*[3단계] 청구명세서 단위로 Chalrlson 동반질환 코딩*/

proc sql;

create table comorbidity as select SPJKEY,

/*01. MI*/

max(case when substr(SICK_CD,2,3) in ('I21', 'I22') or substr(SICK_CD,2,4) in ('I252') then 1 end)

as count_cci01,

/*02. CHF 심부전*/

max(case when substr(SICK_CD,2,3) in ('I43', 'I50') or substr(SICK_CD,2,4) in ('I099', 'I110', 'I130',

'I132', 'I255', 'I420', 'I425', 'I426', 'I427', 'I428', 'I429', 'P290') then 1 end) as count_cci02,

/*03. peri, 말초혈관질환*/

max(case when substr(SICK_CD,2,3) in ('I70', 'I71') or substr(SICK_CD,2,4) in ('I731', 'I738', 'I739',

'I771', 'I790', 'I792', 'K551', 'K558', 'K559', 'Z958', 'Z959') then 1 end) as count_cci03,

/*04. CERE,뇌혈관질환*/

max(case when substr(SICK_CD,2,3) in ('G45', 'G46', 'I60','I61','I62','I63','I64','I65','I66','I67', 'I68',

'I69') or substr(SICK_CD,2,4) in ('H340') then 1 end) as count_cci04,

/*05. Deme, 치매*/

max(case when substr(SICK_CD,2,3) in ('F00','F01','F02','F03','G30') or substr(SICK_CD,2,4) in

('G311','F051') then 1 end) as count_cci05,

/*06. COPD 만성폐질환*/

max(case when substr(SICK_CD,2,3) in ('J40','J41','J42','J43','J44','J45','J46','J47','J60','J61',

'J62','J63','J64','J65','J66','J67') or substr(SICK_CD,2,4) in ('I278','I279','J684','J701','J703')

then 1 end) as count_cci06,

/*07. tiss, Rheumatologic disease 결합조직질환*/

max(case when substr(SICK_CD,2,3) in ('M05','M06','M32','M33','M34') or substr(SICK_CD,2,4) in

('M315','M351','M353','M360') then 1 end) as count_cci07,

/*08. ulcer, Peptic ulcer disease 소화궤양*/

max(case when substr(SICK_CD,2,3) in ('K25','K26','K27','K28') then 1 end) as count_cci08,

/*09. liver, Mild Liver Disease 경도의 간질환*/

max(case when substr(SICK_CD,2,3) in ('B18','K73','K74') or substr(SICK_CD,2,4) in ('K700','K701','

K702','K703','K709','K713','K714','K715','K717','K760','K762','K763','K764','K768','K769','Z944') then 1

end) as count_cci09,

/*10. dm, 당뇨*/

max(case when substr(SICK_CD,2,4) in ('E100','E101','E106','E108','E109','E110','E111',

'E116','E118','E119','E120','E121','E126','E128','E129','E130','E131','E136','E138','E139','E140',

'E141','E146','E148','E149') then 1 end) as count_cci10,

Page 53: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

52

HIRA 빅데이터 브리프

/*12. hemi, Hemiplegia or paraplegia 반신마비*/

max(case when substr(SICK_CD,2,3) in ('G81','G82') or substr(SICK_CD,2,4) in ('G041','G114','G80

1','G802','G830','G831','G832','G833','G834','G839') then 1 end) as count_cci12,

/*13. Renal, Renal diseiase 중등도이상 신장질환*/

max(case when substr(SICK_CD,2,3) in ('N18','N19') or substr(SICK_CD,2,4) in ('I120','I131','N032','

N033','N034','N035','N036','N037','N052','N053','N054','N055','N056',

'N057','N250','Z490','Z491','Z492','Z940','Z992') then 1 end) as count_cci13,

/*14. lymp, 비전이성고형암, 백혈병, 림프종, 다발성 골수종 */

max(case when substr(SICK_CD,2,3) in ('C00','C01','C02','C03','C04','C05','C06','C07','C08',

'C09','C10','C11','C12','C13','C14','C15','C16','C17','C18','C19','C20','C21','C22','C23','C24','C25','C26','C

30','C31','C32','C33','C34','C37','C38','C39','C40','C41','C43','C45','C46','C47','C48','C49','C50','C51','C5

2','C53','C54','C55','C56','C57','C58','C60','C61','C62','C63','C64','C65','C66','C67','C68','C69','C70','C71

','C72','C73','C74','C75','C76','C81','C82','C83','C84','C85','C88','C90','C91','C92','C93','C94','C95','C96',

'C97') then 1 end) as count_cci14,

/*15. liver_s, Moerate or severe liver disease 중등도 이상 간질환*/

max(case when substr(SICK_CD,2,4) in ('I850','I859','I864','I982','K704','K711',

'K721','K729','K765','K766','K767') then 1 end) as count_cci15,

/*16. tumor, Metastatic solid tumor 전이성 고형암*/

max(case when substr(SICK_CD,2,3) in ('C77','C78','C79','C80') then 1 end) as count_cci16,

/*17. AIDS*/

max(case when substr(SICK_CD,2,3) in ('B20','B21','B22','B24') then 1 end) as count_cci17

from temp2

group by SPJKEY; quit;

data comorbidity2; set comorbidity;

total=sum(count_cci01, count_cci02, count_cci03, count_cci04, count_cci05, count_cci06,

count_cci07, count_cci08, count_cci09, count_cci10, count_cci11, count_cci12, count_cci13,

count_cci14, count_cci15, count_cci16, count_cci17);

if total=0 then delete; run; /*Charlson 동반질환이 없는 청구건은 삭제*/

Page 54: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

53

Ⅲ. HIRA 빅데이터 분석 가이드

/*[4단계] index date를 기준으로 1년 전 동반질환 내역만 가져오기*/

proc sort data=index; by pat_hpin; run;

proc sort data=comorbidity2; by pat_hpin; run;

data comorbidity3; merge index comorbidity2; by pat_hpin;

format fol_start_date fol_end_date yymmdd10.;

fol_start_date = input(recu_fr_dd, yymmdd8.);

fol_end_date = input(recu_to_dd, yymmdd8.);

if -365<intck('day',index_start_date,fol_end_date)<0; run;

/*기준 시점의 요양개시일자와 과거 진료내역의 요양종료일자의 차이가 1년 내 청구자료만 가져오기*/

/*[5단계] 청구명세서 단위의 동반질환 내역을 환자 단위로 축소*/

proc sql;

create table comorbidity4 as select *,

max(count_cci1) as ncount_cci1, max(count_cci2) as ncount_cci2,

max(count_cci3) as ncount_cci3, max(count_cci4) as ncount_cci4,

max(count_cci5) as ncount_cci5, max(count_cci6) as ncount_cci6,

max(count_cci7) as ncount_cci7, max(count_cci8) as ncount_cci8,

max(count_cci9) as ncount_cci9, max(count_cci10) as ncount_cci10,

max(count_cci11) as ncount_cci11, max(count_cci12) as ncount_cci12,

max(count_cci13) as ncount_cci13, max(count_cci14) as ncount_cci14,

max(count_cci15) as ncount_cci15, max(count_cci16) as ncount_cci16,

max(count_cci17) as ncount_cci17

from comorbidity3

group by pat_hpin

order by pat_hpin; quit;

proc sort data=comorbidity4 nodupkey out=comorbidity5; by pat_hpin; run;

Page 55: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

54

HIRA 빅데이터 브리프

/*[6단계] Index Data에 동반질환점수 붙이기*/

proc sort data=comorbidity5; by pat_hpin; run;

proc sort data=index; by pat_hpin; run;

data Final; merge index comorbidity5; by pat_hpin;

if ncount_cci1=. then ncount_cci1=0; if ncount_cci2=. then ncount_cci2=0;

if ncount_cci3=. then ncount_cci3=0; if ncount_cci4=. then ncount_cci4=0;

if ncount_cci5=. then ncount_cci5=0; if ncount_cci6=. then ncount_cci6=0;

if ncount_cci7=. then ncount_cci7=0; if ncount_cci8=. then ncount_cci8=0;

if ncount_cci9=. then ncount_cci9=0; if ncount_cci10=. then ncount_cci10=0;

if ncount_cci11=. then ncount_cci11=0; if ncount_cci12=. then ncount_cci12=0;

if ncount_cci13=. then ncount_cci13=0; if ncount_cci14=. then ncount_cci14=0;

if ncount_cci15=. then ncount_cci15=0; if ncount_cci16=. then ncount_cci16=0;

if ncount_cci17=. then ncount_cci17=0; /*동반질환이 없는 환자는 0으로 코딩*/

CCI=(ncount_cci1+ncount_cci2+ncount_cci3+ncount_cci4+ncount_cci5+ncount_cci6+ncount_cci7+

ncount_cci8+ncount_cci9+ncount_cci10+2*ncount_cci11+2*ncount_cci12+2*ncount_cci13+2*ncou

nt_cci14+3*ncount_cci15+6*ncount_cci16+6*ncount_cci17);

CCI_group=CCI;

if CCI>=3 then CCI_group=3; run;

4. 맺음말

건강보험 청구자료를 분석할 때는 환자의 결과에 영향을 줄 수 있는 변수들을 보정하여야 보다

객관적인 인과 추론이 가능함

환자의 결과에 영향을 줄 수 있는 교란변수는 주진단 질환의 중증도, 임상적 상태 등 다양하나,

건강보험 청구자료에서 활용할 수 있는 변수는 연령, 성별, 동반질환 등 임

본 가이드에서는 일반적으로 많이 활용하고 있는 Charlson 동반질환 지수에 대해 설명하고

있지만 연구자 판단에 따라 다양한 방법들이 활용될 수 있음

연구 성격에 따라 동반질환 측정 도구뿐만 아니라 적합한 관찰 기간, 자료 범위를 설정하여야 함

Page 56: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

55

Ⅲ. HIRA 빅데이터 분석 가이드

☞ HIRA 보건의료 빅데이터 이용 안내

‘보건의료빅데이터개방시스템(opendata.hira.or.kr)’에서는 여러 가지 형태의 빅데이터 서비스가

제공되고 있으며, 용도에 따라 적합한 서비스 선택ㆍ이용이 가능함

구 분 내 용

원시자료(raw data) 분석 지원 서비스

연구자 및 산업체가 원하는 맞춤형 원시데이터 분석이 가능하도록 방문 또는 원격 접속으로 빅데이터분석시스템 활용

Open API 실시간 제공 서비스

민간기업, 프로그램 개발자, 인터넷 이용자를 대상으로 손쉽게 직접 응용 프로그램과 서비스를 개발할 수 있도록 병원ㆍ약국 정보 서비스 등 보건의료데이터 지원

환자표본 DB 제공 서비스

연구자의 필요에 따라 환자표본 데이터 등 총 4개의 DB데이터셋을 생성ㆍ제공하여 연구 및 R&D사업에 활용하도록 지원

HIRA 보건의료 빅데이터 이용 절차(원격 접속)

※ 자세한 내용은 ‘보건의료빅데이터개방시스템(opendata.hira.or.kr)’에 접속 후 ‘의료빅데이터’

- ‘빅데이터 분석 이용 안내’ 참고

이용신청

서류제출

수수료납입

자료분석

결과활용통보

Page 57: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

56

HIRA 빅데이터 브리프

Page 58: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료
Page 59: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

발 행 월 2018년 8월

발 행 인 김승택

발 행 처 [26465] 강원도 원주시 혁신로 60

전 화 1644-2000

홈 페 이 지 www.hira.or.kr

디자인·기획 (사)한국근로장애인진흥회 다원디자인프린팅

H I R A빅 데 이 터

브 리 프

Page 60: HIRArepository.hira.or.kr/bitstream/2019.oak/1493/2/HIRA... · 2020. 4. 9. · 보건의료 빅데이터 동향 _ 03 Ⅰ-1.블록체인 기술과 보건의료분야 활용 _ 05 Ⅰ-2.보건의료

26465 강원도 원주시 혁신로 60(반곡동) 건강보험심사평가원 www.hira.or.kr