6
Hallym ICT Policy Journal 20 | 한림ICT정책저널 데이터의 대홍수, 실질적으로 지원할 수 있는 정 보를 위한 데이터 통합의 중요성 현대에 있어서 데이터의 수집, 보관 및 분석은 처리능력 의 향상, 계산 및 보관비용의 하락, 모든 종류의 기기에 포 함된 감지기술의 발달 등에 힘입어 계속적으로 증가하고 있 다. 미국 백악관 대통령실 보고서에 의하면, 2011년에 생성되 고 복제되는 정보는 1.8 제타바이트(zettabyte, 1 제타바이트 =1,000,000,000,000,000,000,000 바이트) 가량이라고 추정되 었으며, 2013년에는 세계적으로 4제타바이트의 정보가 생성될 것이라고 제시되고 있다. 1) 기술적인 진보는 정보의 생산, 획득, 관리 및 저장의 비용을 2005년의 6분의 1 수준으로 낮추었으며, 2005년 이래 하드웨 어, 소프트웨어 등의 관련 산업에의 투자비용은 약 50%가 증 가하여 4조 달러에 이르고 있다. 빅데이터에 있어서 중요한 것은 그것이 무엇을 하는가이다. 우 리가 기술적인 현상으로서의 빅데이터를 어떻게 정의하는지에 대한 문제는 제외하더라도, 빅데이터 분석의 광범위한 잠재적 활용가능성은 인간의 법적·윤리적·사회적 규범들이 빅데이 터의 세계에서 우리의 사생활과 다른 가치들을 충분히 보호할 빅데이터 활용사례 : 정책결정 시스템을 중심으로 동아대학교 석당인재학부 이동규 교수

빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

전략적

김광호 교수

H a l l y m I C T P o l i c y J o u r n a l

20 | 한림ICT정책저널

데이터의 대홍수, 실질적으로 지원할 수 있는 정

보를 위한 데이터 통합의 중요성

현대에 있어서 데이터의 수집, 보관 및 분석은 처리능력

의 향상, 계산 및 보관비용의 하락, 모든 종류의 기기에 포

함된 감지기술의 발달 등에 힘입어 계속적으로 증가하고 있

다. 미국 백악관 대통령실 보고서에 의하면, 2011년에 생성되

고 복제되는 정보는 1.8 제타바이트(zettabyte, 1 제타바이트

=1,000,000,000,000,000,000,000 바이트) 가량이라고 추정되

었으며, 2013년에는 세계적으로 4제타바이트의 정보가 생성될

것이라고 제시되고 있다.1)

기술적인 진보는 정보의 생산, 획득, 관리 및 저장의 비용을

2005년의 6분의 1 수준으로 낮추었으며, 2005년 이래 하드웨

어, 소프트웨어 등의 관련 산업에의 투자비용은 약 50%가 증

가하여 4조 달러에 이르고 있다.

빅데이터에 있어서 중요한 것은 그것이 무엇을 하는가이다. 우

리가 기술적인 현상으로서의 빅데이터를 어떻게 정의하는지에

대한 문제는 제외하더라도, 빅데이터 분석의 광범위한 잠재적

활용가능성은 인간의 법적·윤리적·사회적 규범들이 빅데이

터의 세계에서 우리의 사생활과 다른 가치들을 충분히 보호할

빅데이터 활용사례 : 정책결정 시스템을 중심으로

동아대학교 석당인재학부

이동규 교수

Page 2: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

Hallym Communication Policy Research Center | 21

수 있는 것인가라는 중요한 문제를 제기한다. 여기서 빅데

이터 현상이 단지 정보기술 분야에서의 일시적인 트렌드

가 아닐까 하는 우려를 짚고 넘어갈 필요가 있다. 빅데이

터 현상을 제대로 보기 위해서는 빅데이터 현상을 둘러싸

고 있는 겉포장을 걷어내고 내용적인 본질을 파악할 때 실

질적인 통찰과 가치에 접근할 수 있을 것이다.

즉, 빅데이터 현상이 누군가 의도적으로 발생시킨 일시적

인 유행인지, 아니면 인간이 세상을 이해하고 조직해 온

유구한 흐름과 맞닿아 있는 현상인지, 만약 후자에 가깝다

면 왜 지금 이 현상이 생겨나고 있는 것인지, 비즈니스와

시장, 그리고 사회에 어떠한 영향을 미치고, 어떤 변화를

유발할 것인지, 그 과정에서 어떤 문제가 생겨날 것이고,

그래서 지금 어떤 준비를 해야 하는지 이해할 수 있을 것

이다.

수많은 혼란스러운 논의와 담론들 속에서 확실한 것은 데

이터는 계속 쌓여갈 것이고, 그 규모는 방대해지고 있다

는 점과 어떤 데이터이건 아직 발굴되지 않은 고유한 가

치를 숨기고 있을 가능성이 크다는 점이다. 그런 측면에

서 데이터가 정부나 기업의 중요 자산이자 새로운 사업

모델의 기반이 되고, 그 누구도 가치 있다고 생각하지 못

한 곳에서 데이터를 발굴해내는 능력이 미래에 국가의 핵

심 경쟁력이 되리라는 예상은 설득력을 갖는다. 문제는

‘어떻게’이다.

90년대 이후 우리 사회가 공들여 온 정보화 내지 전산화

과정에 의해 정부기관이나 기업은 매우 많은 정보들을 축

적해 왔다. 그 중 일부는 실제로 ‘빅데이터’이기도 하다. 그

러나 많은 데이터가 활용되지 못한 채 사장되어 있거나 주

기적으로 삭제되고 있으며, 데이터로부터 의사결정의 객

관적 근거와 혁신의 동인을 발견하겠다는 의식도 미흡했

던 것이 사실이다. 데이터 분석의 세부 프로세스로 들어가

면 상황은 더 나빠진다. 정상적인 분석의 사이클이 한 바

퀴 수행되는 과정에서 무수한 난관에 부딪히게 된다. 데이

터의 정확성이나 정합성, 누락 문제는 차치하고서라도 각

단계에서 필요한 데이터가 즉시 입수될 수 있도록 데이터

가 수집, 관리되고 있지 않는 것이 현실이다.

실제로 공공데이터를 개방하고 활용하는 법이 통과되어

시행되고 있지만 그 활용이 민간에서 제대로 이루어지지

않은 문제 역시 이러한 현실과 연결되어 있다. 서로 연관

성이 커서 분석과정에서 통합·활용되어야 할 필요가 있

는 데이터들이 분산되어 관리되고 있어 분석업무의 효율

성을 저하시키고, 경우에 따라서는 부서 간 협조가 쉽지

않아 필요한 데이터를 확보하지 못하는 경우도 흔히 겪게

되는 상황이다. 빅데이터 사업의 성공적인 추진을 위해서

는 내부 데이터의 통합과 외부 데이터와의 연계 체계가 안

정적으로 구축되어야 한다.

이를 위해서는 데이터에 관한 통합적인 주도권과 강력한

리더십을 발휘할 수 있는 조직적인 데이터 코어가 필요하

다. 시스템 통합 이전에 데이터 통합이 우선 필요한 것이

다. 따라서 이러한 논의를 기초로 주요 국가의 빅데이터 활

용 사례를 살펴보고자 한다. 국내외에서는 이러한 문제를

해결하기 위한 여러 노력을 하고 있다. 한정된 논의를 위해

정책결정 또는 의사결정 시스템에서 데이터 통합을 어떻게

활용하는지에 대한 대표적 사례를 검토하고자 한다.

미래전망을 위한 정책결정 시스템 :

EU의 iKnow(interconnected Knowledge)

프로젝트

본 프로젝트는 EU의 미래전망 연구 프로그램의 하나

1) Executive Office of the President, Big Data : Seizing Opportunities, Preserving Values, The White House, 2014, p. 1.

Page 3: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

22 | 한림ICT정책저널

로서, 유럽과 전 세계의 과학·기술·혁신(Science,

Technology, Innovation : STI) 분야의 미래를 변화시키고

설계하기 위한 주제와 지식을 공유하는 것을 목적으로 한

다. 미래 전망의 불확실성 극복 및 다양성 확보를 위해 사

회·경제·기술·과학·인문학 등의 다양한 전문가가 참

여하고 있다. 2)

기반이 되는 자료는 다음과 같다. ① FP7(7th Framework

Programme for Research and Technological

Development) 연구 프로젝트로부터 생성되는 구조화된

자료, ② 국제기구 및 업계, 각종 비정부기구(NGO), 블로

그, 공상과학소설, 잡지, ③ 미래연구 및 과학기술 분야 전

문가와의 인터뷰, ④ 핀란드, 영국, 독일 등 국가간 워크샵

및 통계조사 등을 통하여 수집한다.3)

구체적으로는 ILTD(inward-looking top-down),

OLTD(outward-looking top-down), ILBU(inward-looking

bottom-up), OLBU(outward-looking bottom-up)의 방식

을 사용하여, iKnow 컨소시엄 구성원들로부터(ILTD), 전 세

계의 웹 사이트·블로그·뉴스 및 저널·보고서 및 공상

과학소설 등으로부터(OLTD), 유럽의 정부·업계·학계·

비정부기구로부터(OLBU), 전 세계 iKnow 커뮤니티 회원들

로부터 획득한 와일드카드(wild card, 발생가능성은 낮지

만 발생하는 경우 광범위한 사회적 파장을 야기할 수 있는

사건) 및 취약신호(weak signal, 사회 변화의 개시를 알리

는 신호)들을 연계하여 조사한다.4)

현재 2,664개의 구성기관 및 구성원들이 참여하고 있으며

501개의 와일드카드와 396개의 취약신호에 대한 연구를

진행하고 있다.5)

<그림 1> iKnow의 개념도6)

좋은 의사결정 구축 시스템으로의 UN Global

Pulse의 헌치워크스(HunchWorks)

헌치워크스(HunchWorks)는 인간의 불완전성과 미래예측

의 불확실성을 인정하고, 그 한계를 ‘좋은 의사결정 과정

을 구축하는 것’으로 극복하려고하는 첫 번째 시도이다. 인

류 역사를 통틀어 인간은 수많은 예측을 해왔고, 지금도 매

일, 매순간 예측을 하고 그에 의거하여 삶을 영위하고 있지

만 맞힌 예측보다 빗나간 예측이 압도적으로 많았다는 것

은 자명한 사실이다.

UN에서는 급격하게 대두하는 위험을 즉각적으로 분석

하기 위해 정보의 흐름을 완벽하게 창조할 수 있는 체계

(mechanism) 또는 생태계(ecosystem)가 필요함을 인

2) 한국정보화진흥원 빅데이터 전략연구센터, 더 나은 미래를 위한 데이터 분석 : Big Data 글로벌 선진사례 II(이하 ‘데이터 분석’이라 한다), 2013, p. 8.

3) 한국정보화진흥원 빅데이터 전략연구센터, 데이터 분석, p. 9.

4) 한국정보화진흥원 빅데이터 전략연구센터, 데이터 분석, p. 9.

5) http://wiwe.iknowfutures.eu/

6) http://wiwe.iknowfutures.eu/iknow-description/

Page 4: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

Hallym Communication Policy Research Center | 23

식하였다. 따라서 이를 바탕으로 통합적인 정보연결망의

수립을 추구하고 있다. 즉 흩어지고 구조화되지 않은 실

시간 정보들을 확고한 사실의 단편으로 결합시킬 수 있

도록 하는 연결조직을 수립하여 현장에 있는 UN 직원

들 및 수많은 전문가들과 조직 전반에 (비록 해체되어 부

분별로 나뉘어져 있기는 하지만) 분포되어 있는 상황 정

보들을 단순히 증폭시키는 것이 아니라 부분적이고 불

안전한 정보들에 기초한 가설을, 그러한 가설이 정보망

(network) 상의 다른 사용자들로부터 자료와 분석을 이

끌어 내는 유인자로 활동하는 방식으로 활용할 수 있는

안전한 공간을 창출하려 하고 있다.7)

이러한 사고방식을 바탕으로 만들어진 헌치워크스

(HunchWorks)는 세계최초로 가설을 형성하고, 증거를 수

집하며, 집합적인 의사결정을 내리는 사회적 네트워크이

다. 헌치워크스(HunchWorks)는 연구자들로 하여금 상호

보완적인 자료를 가지고 있는 다른 전문가들과 연계하여

그들이 함께 단편적인 조각들로 나뉘어져 있는 자료들이

발신하는 신호가 위험이 증가되고 있음을 알리는 것인지

의 여부를 결정하도록 하고, 주고 추가적인 조사를 진행할

수 있도록 한다.

헌치워크스(HunchWorks)의 기능적 메커니즘은 첫째, 관

심을 끄는 약한 신호를 감지(빅데이터 분석 및 모니터링),

둘째, 신호의 성격을 가설화(헌치 생성), 셋째, 헌치를 네

트워크에 공유, 넷째, 헌치가 시드가 되어 연관 신호와 다

른 증거들을 수집, 다섯째, 지식 커뮤니티(communities of

practice)의 관여를 통해 신속하게 타당성 검증(소셜 네트

워크 동학), 여섯째, 확정된 헌치를 재난 대응 행동의 기초

로 활용하고, 검증과정에 참여한 전문가들의 신뢰도를 시

스템 내에서 조정하는 기능으로 구성되어 있다.

충분한 증거가 수집되었을 때 최초의 헌치 생성자는 집

계된 증거와 신뢰도를 바탕으로 헌치의 상태를 ‘입증

(Proven)’, ‘미입증(Disproven)’, ‘종료(Closed)’ 중 하나로

변화시키게 된다.

우선, 전문가들이 증거(evidence)의 형태를 세분화하여 제

시하도록 하고, 각 증거들이 헌치의 내용을 지지하는 정도

에 대해 전문가들이 직접 상호평가를 할 수 있게 해놓았

다. 증거의 형태는 트윗, 데이터셋, 링크, 사진, 동영상, 관

찰내용 등이 가능하며, 집단적으로 평가된 증거들이 집계

되어 헌치의 신뢰수준을 자동적으로 집계한다.

Big Data 영역

연속적 모니터링

이상패턴감지

헌치 생성 헌치 분할/통합 가능

Human Expertise 영역

Proven

Disproven

Closed

전문가 네트워크 공유

새로운 증거 수집

추가된 증거 평가

헌치 신뢰도 집계

헌치 상태 변경

의사결정 및 대응행동

<그림 2> 헌치워크스 시스템 작동 매커니즘

헌치워크스(HunchWorks)는 빅데이터에 대한 인간의 시각

을 투영하여 증거의 수집과 통합적 활동을 증진시키기 위

한 사회 네트워크(social networks)를 활용하는 것을 목적

으로 하고 있다. 즉 전세계적으로 불안정성과 복합적 위

험이 증가하고 있는 시대에, 전세계의 전문가들이 퍼즐의

조각을 보다 빨리 조립하도록 하고 보다 빨리 취약한 사람

들에게 반응할 수 있도록 하는 기능을 수행하는 것이다.

7) 이하 http://www.unglobalpulse.org/blog/why-hunchworks

Page 5: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

24 | 한림ICT정책저널

전략적 의사결정 시스템으로의 싱가포르 국

가안보조정사무국(NSCS)의 RAHS(Risk

Assessment Horizontal Scanning)

2004년에 시작된 미래예측 및 위험측정사업(RASH)은 다

양한 국가적 위험 데이터를 수집·분석하여 싱가포르에 심

각한 영향을 미칠 수 있는 전략적 주제에 대한 가상 시나

리오의 분석을 통하여 사전 예측 및 대응방안을 모색하는

것을 주목적으로 한다. 이러한 모니터링과 분석을 통하여

해상안보 정책, 질병예측 및 대응정책, 인구정책, 교육발전

정책 등을 지원하고 있다.8)

예를 들어, 2011년에 종료된 RAHS의 사업은 싱가포르 청

년층의 이민에 대한 태도분석(Examining the Attitudes

of Young Singaporeans towards Emigration), 주택정책

에 대한 공적 관심의 조사에 대한 주택시장의 정서 이해

(Understanding Housing Market Sentiments to Examine

Public Concern towards Housing Policies), 실력주의에

입각한 학생교육전략의 수립(Developing Strategies for

Building Student - Centric Meritocracy) 등이다.9)

RASH 시스템의 활용도가 높아짐에 따라 2012년부터

RASH Program Office를 설립하여 업무의 체계적 수행을

위한 3개의 센터를 운영하고 있다. 이는 각각 분석(RAHS

Think Center), 해결책 제시(RAHS Solutions Center), 실험

(RAHS Experimentation Center)의 역할을 수행하며, 구체

적으로는 정책입안자들에게 국가안보와 관련되어 새롭게

부각되는 위험이나 기회에 대해서 환기시키고, 정책집행자

들에게 전략적 예측을 활용하고 새로운 개념을 이해할 수

있도록 하며, 마지막으로 새로운 기술을 RAHS 체계에 접

목할 수 있도록 한다.10)

이상의 논의를 정리하면 다음과 같다. 빅데이터의 중요한

특성 중의 하나는 단절적으로 축적된 데이터가 아니라 지

속적으로, 그리고 빠르게 유입되는 흐름(stream data)이라

는 점이다.

광범위하게 설치된 물리적 센서들이 수집하는 데이터나

소셜 미디어 데이터는 주기적 또는 비주기적으로 많은 양

의 데이터를 쏟아내는데, 이런 데이터를 모니터링하거나

분석하여 의사결정과 사후 행동이 가능한 정보로 변환하

기 위해서는 보다 연속적인 접근이 필요하다.

RAHS PROGRAMME OFFICE

RAHS THINKCenter

Excite policymakers withinsights to emerging

risks and opportunitieswith national security

implications

RAHS SOLUTIONSCenter

Enable policypractitioners withcompetencies in

strategic anticipationand explore new

concepts

RAHS EXPERIMENTATIONCenter

Experiment withemerging processes and

technologies andintegrating them into the

RAHS system

8) http://www.rahs.gov.sg/public/www/content.aspx?sid=2952

9) http://app.rahs.gov.sg/public/www/content.aspx?sid=2957

10) http://app.rahs.gov.sg/public/www/home.aspx

11) http://nsworld.org/sites/nsworld.org/files/findings/findings5/rahs.jpg

<그림 3> RAHS의 Program Office의 조직 11)

Page 6: 빅데이터 활용사례 : 정책결정 시스템을 중심으로ict.hallym.ac.kr/webzine/02/03.pdf · 좋은 의사결정 구축 시스템으로의 UN Global Pulse의 헌치워크스(HunchWorks)

Hallym Communication Policy Research Center | 25

즉, 상시적인 모니터링 과정에서 구체적인 의사결정과 행

동이 필요할 때를 결정하기 위한 새로운 절차가 필요한 것

이다. 이런 관점에서 EU의 iKnow 시스템, UN 글로벌 펄스

(Global Pulse) 혁신 연구실의 헌치워크스(HunchWorks)

시스템, 싱가포르의 RASH 시스템은 정책결정 또는 의사결

정을 위해 빅데이터를 활용하여 실질적으로 지원할 수 있

는 정보(actionable information)를 제공하고 있는 사례로

시사점을 제시한다.

<표 1> 종합정리

구 분 EU의 iKnow UN의 HunchWorks 싱가포르의 RASH

분석 기술수준 예측적 분석 예측적 분석 예측적 분석

연구개발 주제 EU의 미래전망 연구에 대한 의사결정 좋은 의사결정 과정을

구축하는 것

싱가포르에 심각한 영향을 미칠 수 있는 전

략적 주제에 대한 의사결정

전문가와 역할분담

각 구성원들의 유기적 협력(유럽의 정부·

업계·학계·비정부기구로부터(OLBU), 전

세계 iKnow 커뮤니티 회원들)

각 구성원들의 유기적 협력(연

구자들과 전문가들)

RAHS Program Office 산하 Think Center,

Solutions Center, Experimentatiom Center

역할분담

분석 프로세스

구성원들 및 블로그·잡지 등과 같은 내·

외의 정보를 취합하여 각 구성원들의 공동

작업을 통하여 분석

구성 연구기관들이 제기한 가

설에 대하여 전 세계적인 네트

워크를 통하여 검증

전략적 주제에 대한 가상 시나리오의 분석

→ 사전 예측 및 대응방안을 모색하는 것

빅데이터 활용

및 분석

(데이터 통합)

전 세계의 웹 사이트·블로그·뉴스 및 저

널·보고서 및 공상과학소설 (OLTD) 유럽

의 정부·업계·학계·비정부기구로부터

(OLBU), 전 세계 iKnow 커뮤니티 회원들로

부터 획득한 와일드카드(wild card, 발생가

능성은 낮지만 발생하는 경우 광범위한 사

회적 파장을 야기할 수 있는 사건) 및 취약

신호(weak signal, 사회 변화의 개시를 알

리는 신호) 등을 중심으로 수집 및 분석

트윗, 데이터셋, 링크, 사진, 동

영상, 관찰내용 등을 중심으로

수집 및 분석

다양한 국가적 위험 데이터를 수집 및 분석

9) Davenport, T. H. (2013). The Rise of Analytics 3.0: How to Compete in the Data Economy.

International Institute for Analytics.

10) Gartner. (2011). Gartner's Business Analytics Framework.

11) International Federation of Red Cross and Red Crescent Societies (IFRC). (2013). World 12)

Disasters Report 2013: Focus on technology and the future of humanitarian action. Geneva:

IFRC.

기타자료

http://wiwe.iknowfutures.eu/

http://wiwe.iknowfutures.eu/iknow-description/

http://www.unglobalpulse.org/projects

http://www.rahs.gov.sg/public/www/content.aspx?sid=2952

http://app.rahs.gov.sg/public/www/home.aspx

http://nsworld.org/sites/nsworld.org/files/findings/findings5/rahs.jpg

참고문헌

1) Davenport, T. H. (2014). 「빅 데이터 @ 워크」. (김진호, 옮김). 서울: 21세기북스. (원서출판 2014)

2) Schönberger, V. M. (2013). 「빅데이터가 만드는 세상」. (이지연, 옮김). 서울: 21세기북스. (원서

출판 2013)

3) Silver, N. (2014). 「신호와 소음」. (이경식, 옮김). 서울: 도서출판길벗. (원서출판 2012)

4) 한국정보화진흥원 빅데이터 전략연구센터(2013). 더 나은 미래를 위한 데이터 분석 : Big Data 글

로벌 선진사례 II(이하 ‘데이터 분석’이라 한다)

5) Burkett, M. (2014). Big Data & Supply Chain Analytics: Separating Facts from Fiction. SCC

Global Member Meeting and Supply Chain World North America.

6) Choi, H., Varian, H. (2012). Predicting the Present with Google Trends. Economic Record,

88(s1), 2-9.

7) Executive Office of the President.(2014), Big Data : Seizing Opportunities, Preserving Values,

The White House.

8) Chris van der Walt, Perterson, D., Farmer, S. (2011). HunchWorks: Combining human

expertise and big data. UN.