14
6 Ⅰ. 보건의료 빅데이터 동향 1. 들어가는 글 딥러닝(Deep learning)을 필두로 하는 인공지능이 영상 분석, 음성인식 등 다양한 분야에서 우수한성과를보이며,보건의료분야에서도인공지능에대한기대감이높아짐 실제로의학논문검색엔진인PubMed 1) 에서인공지능관련키워드로검색되는논문들은그림1과 같이증가하고있음 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망 윤덕용교수 아주대학교의료정보학과 [그림 1]연도별인공지능관련키워드를가진논문의수(~2018년) The number of publications 7000 6000 5000 4000 3000 2000 1000 0 1950 1960 1970 1980 1990 2000 2010 2020 Deep learing Machine learing Artificial learing 특히알파고등장시점인2015년을기점으로딥러닝관련논문들이급속하게늘어나고있음

보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

6

Ⅰ. 보건의료 빅데이터 동향

1. 들어가는 글

●● �딥러닝(Deep� learning)을�필두로�하는�인공지능이�영상�분석,�음성인식�등�다양한�분야에서�

우수한�성과를�보이며,�보건의료�분야에서도�인공지능에�대한�기대감이�높아짐

●● �실제로�의학�논문�검색�엔진인�PubMed1)�에서�인공지능�관련�키워드로�검색되는�논문들은�그림�1과��

같이�증가하고�있음

보건의료 분야에서의 인공지능과

기계학습 활용 및 전망윤덕용�교수�

아주대학교�의료정보학과

[그림 1]��연도별�인공지능�관련�키워드를�가진�논문의�수(~2018년)

The

num

ber o

f pub

licat

ions

7000

6000

5000

4000

3000

2000

1000

0

1950 1960 1970 1980 1990 2000 2010 2020

Deep learing Machine learing Artificial learing

●● �특히�알파고�등장�시점인�2015년을�기점으로�딥러닝�관련�논문들이�급속하게�늘어나고�있음

Page 2: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

76

HIRA 빅데이터 브리프

●● �하지만�인공지능을�공부하는데�있어서의�높은�학습�장벽�때문에�아직�보건의료�분야의�많은�

연구자들은�인공지능에�대해�막연한�기대감만을�갖고�있는�경우가�많음

●● �따라서,�본�고에서는�인공지능,�기계학습,�딥러닝에�대한�기본적인�개념을�간단히�설명하고,�보건�

의료�분야에서�활용된�사례와�향후�전망에�대해�살펴보고자�함

2. 인공지능과 기계학습

[그림 2]��인공지능,�기계학습,�딥러닝�간의�관계�도식도

2.1 인공지능

●● �딥러닝이�인공지능�분야의�대표적인�알고리즘으로�자리잡으면서,�딥러닝이�곧�인공지능으로�

표현되는�경우가�많으나,�인공지능은�훨씬�광범위한�개념임

�▶ 전통적인�정의에�따르면�인간의�지능을�흉내내는�모든�프로그램을�인공지능이라고�할�수�있음2)�

●● �현재�과학�기술로는�실제�지능의�원리에�대해서도�자세하게�밝히지�못하고�있기�때문에,�이를�

인공적으로�만든다는�것은�불가능함�

Page 3: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

8

Ⅰ. 보건의료 빅데이터 동향

�▶ �따라서�지능의�원리는�따지지�않고�프로그램의�결과가�인간의�지능과�유사한�결과를�보인다면�

인공지능이라고�할�수�있어,�의사결정나무,�Support�vector�machine,�인공�신경망�등�다양한�

알고리즘이�존재함

�▶ �예를�들어,�어떤�전문가의�경험을�바탕으로�작성된�단순한�순서도(flowchart)�기반의�프로그램도�

입력에�대한�결과�반응이�인간의�반응과�유사하다면�인공지능이�될�수�있음

2.2 기계학습

●● �기계학습(machine�learning,�ML)은�인공지능의�여러�분야�중�한�분야에�속함(그림�2)

�▶ �기계학습은�다양한�방법을�이용해서�데이터에�존재하는�어떤�패턴을�찾아가는�특징이�있어�‘학습’�

이라는�단어가�붙음�

●● �기계학습은�비지도학습(unsupervised� learning),�지도학습(supervised� learning),�강화학습

(reinforcement�learning)으로�분류됨

�▶ �비지도학습�:�학습하는�데이터에�특정�그룹에�대한�정보(label)�없이�데이터�내에�존재하는�

패턴을�찾는�방법으로,�그림�3의�좌측�데이터를�x,�y축의�값을�기반으로�하여�우측과�같이�두�

그룹으로�나눌�수�있음�

[그림 3]��비지도학습�결과�예시

Page 4: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

98

HIRA 빅데이터 브리프

�▶ �지도학습�:�지도학습은�학습하는�데이터에�특정�그룹에�대한�정보(label)가�있어�주어진�정보에�

맞춰�패턴을�찾는�방법으로,�그룹에�대한�정보를�바탕으로�그림�3과�동일한�데이터를�분석한다면�

결과는�그림�4와�같이�달라짐(화살표)

�▶ �강화학습�:�강화학습은�시행착오를�겪으며�가장�높은�보상을�받는�행동의�정책을�학습하는�분야로,�

그림�5에서�오른쪽으로�가능�행동은�+10점의�보상,�왼쪽으로�가는�행동은�-10점의�패널티를�

준다면�여러�번의�시행착오를�겪은�후,�오른쪽으로�가는�행동이�좋다는�것을�학습하게�됨

�▶ �딥러닝�:�딥러닝은�패턴을�학습하는�방법,�즉�알고리즘에�대한�이름으로�그림�2에서�제시된�

바와�같이�비지도�학습,�지도�학습,�강화�학습에�모두�사용될�수�있음.�인공�신경망�알고리즘을�

여러�겹(깊게)�붙여�사용하여�딥러닝이라고�불리움

[그림 5]��강화학습�결과�예시

정책수립�

→�오른쪽�선택

강화�학습

경험(행동,�보상)

-10 +10

[그림 4]��지도학습�결과�예시

Page 5: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

10

Ⅰ. 보건의료 빅데이터 동향

3. 인공지능과 데이터

●● �앞서�살펴본�바와�같이,�인공지능의�개념은�매우�광범위하지만�현재�가장�주목받고�있는�분야는�

데이터에�기반한�방법인�기계학습이며,�그�중에서도�딥러닝이�비지도,�지도,�강화학습�분야에서�

가장�활발하게�사용되고�있음

�▶ �기계학습�알고리즘은�데이터로부터�패턴을�학습하여�데이터가�많을수록�좋은�성능을�보이며,�

특히�딥러닝�기반�모델의�경우�모델의�복잡성이�높아�더�많은�데이터가�필요함

●● �대부분의�산업�분야에서�정보화가�이루어지고,�데이터�저장에�필요한�비용이�급격하게�감소하면서�

가용�데이터의�양이�급속하게�증가함

�▶ �2010년대�초반,�전�세계의�데이터�양은�5zettabytes�미만이었지만�2018년도에는�33zettabytes,�

2025년도에는�175zettabytes에�이를�것으로�예상되고�있음3)�

●● �데이터의�양이�급속하게�증가하면서�특히�많은�데이터가�요구되는�딥러닝의�성능이�월등하게�

좋아짐에�따라�딥러닝에�대한�기대가�커짐

�▶ �하지만�한�사람이�생산하는�수많은�정보�중�병원에서는�아주�일부만이�수집되고�있어,�보건의료�

분야에서�충분한�데이터가�수집되고�있는지�고민이�필요함

[그림 6]��데이터와�기계학습�알고리즘의�성능�간의�관계

Deep learning

Most other algorithms

Perfo

rman

ce

Amount of Data

Page 6: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

1110

HIRA 빅데이터 브리프

[그림 8]��아주대학교병원�생체신호�데이터�수집�인프라�구축�현황

●● �아주대학교�병원에서는�이러한�문제를�해결하기�위해�병원에서�수집이�가능한�데이터이지만,�

놓치고�있는�데이터들을�최대한�자동적으로�수집할�수�있는�인프라�확충에�노력하고�있음

�▶ �대표적인�예로�중환자실�및�수술실에서�측정되는�생체신호(심전도,�연속측정�동맥혈압,�호흡�

등)를�파형데이터�원본�그대로�실시간으로�수집하는�인프라를�구축하여�운영�중

[그림 7]��한�사람으로부터�수집�가능한�데이터�중�수집�여부에�따른�분포

Data not recorded

Data recorded outside the hospital

Data recorded in the hospital

Page 7: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

12

Ⅰ. 보건의료 빅데이터 동향

�▶ �2019년� 3월�현재�기준,� 약� 11,000여명의�환자로부터�생체신호�데이터를�수집하였으며,�

수집된�모든�파형데이터의�총�길이는�약�650년에�달함

[그림 9]��생체신호�데이터�수집�인프라�구축을�위한�작업�현장�사진

Page 8: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

1312

HIRA 빅데이터 브리프

4. 보건의료 분야에서의 활용 사례

4.1 비지도학습 : 의학용어 유사도 계산 사례

●● �의학용어들간의�유사도를�계산하기�위해서는�개별�용어들을�계산�가능하도록�수치화하는�과정이�

필요한데,�이를�위해�의학용어들의�사용�패턴을�학습하게�하면�각�개념들을�수치화하여�표현할�

수�있음

[그림 10]��Med2Vec을�이용한�의학용어의�수치화�예시

�▶ �각�의학용어들은�사용된�기록만�있고,�어떠한�개념인지에�대한�label은�사용되지�않았으며,�

단순히�전자의무기록�내에서�사용된�패턴만을�보고�학습하였기�때문에�비지도학습에�해당됨

�▶ �이렇게�수치화된�개념들은�유사한�의학용어를�추천해�주거나,�유사한�환자들을�찾는데�활용될�

수�있음

Page 9: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

14

Ⅰ. 보건의료 빅데이터 동향

●● �그림�11은�임상시험�대상자를�찾는�프로그램에�응용된�사례로�특정�약물을�검색하면�비슷한�

사용�패턴을�보였던�약물들을,� 일부�환자군을�선택하면�유사한�환자군들을�추천해줌으로써�

분석과정을�지원함

●● �이렇게�비지도학습을�통해�추출된�패턴은�원본의�고차원�데이터에서�의미�있는�인자들이�추출된

(추상화된)�결과이기�때문에,�지도학습이나�강화학습의�입력�데이터로�유용하게�사용될�수�있음

4.2 지도학습 : 중환자실 내 패혈증 발생 예측 모델 개발 사례

●● �본�연구진은�패혈증이�발생한�환자군에서�패혈증이�발생하기�1시간�전의�생체신호�데이터와�

패혈증이�발생하지�않은�환자의�생체신호�데이터를�분석하여,�패혈증을�조기에�예측할�수�있는�

모델을�개발하였음

[그림 11]��Metformin과�유사한�사용�패턴을�보이는�약물을�추천해주는�화면

[그림 12]��패혈증�예측�모델�개발�연구�모식도

Page 10: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

1514

HIRA 빅데이터 브리프

[그림 13]��패혈증�예측�모델�구조

[그림 14]��패혈증�발생�예측�모델�기반�패혈증�위험도�분석�결과�예시

�▶ �예측�모델의�구조는�그림�13과�같이�심전도(ECG),�맥박�파형(PPG),�호흡�파형(RESPIMP)�

데이터를�분석한�후,�패혈증�발생에�대한�예측�여부를�결과로�내도록�되어�있음

�▶ �실제�임상데이터에�적용ㆍ평가하여�현재�약�85%의�정확도를�확보하였으며,�그림�14과�같이�

시간별로�특정�환자의�패혈증�발생�위험도를�계산할�수�있음

Page 11: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

16

Ⅰ. 보건의료 빅데이터 동향

4.3 강화학습 : 패혈증 환자에 대한 승압제 및 수액 치료 전략

수립 사례

●● �최근�Nature�medicine지에�발표된�논문에�따르면,�중환자실에서�치료했던�데이터를�기반으로�

가상의�임상�환경을�마련해�두고,�그�안에서�시행착오를�경험하며�적절한�승압제와�수액치료를�할�

수�있도록�인공지능�모델을�학습시킴5)�

�▶ �그�결과,�실제�의료진의�치료�정책보다�인공지능의�치료�정책이�더�많은�환자를�살릴�수�있을�

것이라고�평가됨

[그림 15]��Nature�medicine지에�소개된�AI�clinician�논문�

(https://www.nature.com/articles/s41591-018-0213-5)

Page 12: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

1716

HIRA 빅데이터 브리프

5. 미래 전망

●● �앞서�살펴본�내용들을�바탕으로�보건의료�분야의�빅데이터에서�인공지능�및�기계학습이�적용되는�

과정을�보면�그림�16과�같음

[그림 16]��보건의료�빅데이터�기반�인공지능�적용�프로세스�개요

�▶ �보건의료�분야에서�기계학습의�적용을�위해서는�의료현장에서�의미�있는�데이터를�정확히,�

많이�수집하려는�노력이�필요함�

�▶ �이렇게�수집된�원본�데이터는�매우�고차원이며�복잡하기�때문에�중요한�특징을�추출하는�

과정이�필요함(비지도학습)

�▶ �이후�질병의�여부�등을�판단하거나�예측모델의�개발을�위해서�질병에�대한�정보가�포함된�

데이터�학습이�필요함(지도학습)

�▶ �또한�다양한�임상�상황에�맞는�최적의�치료�전략을�수립하는�일도�중요함(강화학습)

Page 13: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

18

Ⅰ. 보건의료 빅데이터 동향

●● �현재�앞서�나열한�프로세스의�각�부분들�혹은�몇몇�부분들이�연계된�형태의�연구들이�활발하게�

진행되고�있음

�▶ �각�부분의�연구들에서�우수한�연구�성과들이�도출되고�있어,�향후�가까운�미래에서는�모든�

프로세스가�연계되어�궁극적인�AI�clinician이�등장할�수�있을�것으로�기대됨

●● �AI�clinician은�다음과�같은�점에서�인간보다�우수한�능력을�보여줄�것으로�예상됨

�▶ 환자로부터�필요한�데이터를�보다�효율적으로�수집함

�▶ 환자로부터�수집한�데이터를�보다�적절하게�추상화함

�▶ 정확한�진단을�먼저�내릴�수�있음

�▶ 효과적인�치료�전략을�수립할�수�있음

�▶ 데이터�및�문헌을�참고하여�새로운�지식을�보다�빠르게�습득

●● �따라서�보건의료�분야에서�활용될�인공지능�기술에�대한�관심을�넘어,�향후�개발될�AI�clinician

과의�공존�방향에�대해서도�고민이�필요함

Page 14: 보건의료 분야에서의 인공지능과 기계학습 활용 및 전망repository.hira.or.kr/bitstream/2019.oak/1468/2/보건의료... · 따라서, 본 고에서는 인공지능,

1918

HIRA 빅데이터 브리프

참고문헌

1.��PubMed.�https://www.ncbi.nlm.nih.gov/pubmed/.

2.��Russell�SJN,�Peter.�Artificial�Intelligence�:�A�Modern�Approach��

(3rd�ed.�:�Upper�Saddle�River,�New�Jersey�:�Prentice�Hall;�2009.

3.��Rydning�DRJGJ.�The�Digitization�of�the�World�From�Edge�to�Core.�2018.

4.��Sun�ECMTBESCCJ.�Multi-layer�Representation�Learning�for�Medical�Concepts.�

CoRR.�2016.

5.��Komorowski�M,�Celi�LA,�Badawi�O,�Gordon�AC,�Faisal�AA.�The�Artificial�

Intelligence�Clinician�learns�optimal�treatment�strategies�for�sepsis�in�intensive�

care.�Nat�Med.�2018;24(11)�:�1716-1720.