13

@AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

106 ․ 상장협연구 제67호 2013/4

▧ 시사논단 ▧

빅데이터의 활용

- 경영을 과학으로 -

35) 장 영 재*

<목 차>

Ⅰ. 머니볼

Ⅱ. 빅데이터의 시작

Ⅲ. 기업의 새로운 경쟁력 빅데이터

애널리틱스

Ⅳ. 빅데이터와 애널리틱스

Ⅴ. 빅데이터의 새로운 패러다임

<요 약>

‘빅데이터’가 경영의 새로운 화두로 떠오르고 있다. 빅데이터란 기존 데이터베이스 시스템으

로는 저장과 운영이 불가능한 페타바이트(petabyte)나 제타바이트(zettabyte)단위에 이르는 엄청

난 양의 데이터를 의미하는 단어로 이미 수 년 전부터 컴퓨터공학자들 간에 통용되어온 단어

다. 최근 선진 기업들은 이러한 엄청난 양의 데이터를 기업의 경쟁력으로 승화시켜 성공스토리

를 만들어 내고 있다. 그러나 빅데이터가 화두로 떠오르게 된 이유가 시중에 유통되는 데이터

의 총량이 폭증했기 때문만은 아니다. 빅데이터는 기존 비즈니스의 운영방식과 의사결정 사고

의 틀마저 뒤집어 놓는 거대한 패러다임으로 다가오고 있기 때문이다. 특히 데이터가 만들어낸

새로운 가치인 ‘애널리틱스’, 즉 수학적 알고리즘을 통한 기업 운영은 경영을 과학의 영역으로

진화시키고 있다. 가격결정, 상품광고, 고객분류, 재고설정 등 다양한 영역에서 이미 그 효용을

입증하고 있고 발전하고 있다. 필자가 실제 경험한 사례를 통해 빅데이터가 창조하는 새로운

시대와 패러다임, 그리고 애널리틱스에 대해 알아본다.

<주제어> 빅데이터

* 한국과학기술원 산업 및 시스템공학과 교수, [email protected]

Page 2: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 107

Ⅰ. 머니볼

뚱뚱해서 도루를 못하는 1번 타자. 팔꿈치 수술로 공 던지는데 무리가 있는 1루수. 선

천적으로 발이 휜 만곡족 장애인인 주전 투수. 모든 구단이 퇴물로 여겨 방출했지만 무

슨 연유에선지 7번 타자를 맡은 40대의 타자. 이 정도 팀이면 괴짜 외인구단 뺨칠 정도

의 라인업이다. 여기에 감독과 운영 프런트는 더 가관이다. 절대로 도루나 희생번트 지

시를 하지 않는 감독, 구단 운영에서 경기 작전 지도까지 구단의 모든 사사로운 일에 직

접 간여하는 구단주, 선수 영입 시 직접 선수를 보지도 않고 통계 수치만으로 선수를 결

정하는 스카우트 담당자.

영화 속의 야구팀이냐고? 천만에. 영화에서는 볼 법한 이런 선수, 감독, 프런트를 보유

했던 실제 구단이 있었는데, 바로 2000-2003년 시즌 미국 메이저리그 오클랜드 애슬레틱

스였다. 이 시즌 동안 애슬레틱스는 4년 연속 포스트 시즌에 진출하는 경이로운 기록을

달성했다. 여기에 더욱 놀라운 사실은 이 기록이 당시 메이저리그 최고 부자 구단인 뉴

욕 양키스 팀 연봉의 불과 삼분의 일도 안 되는 애슬레틱스 선수들이 이뤄낸 성과란 점

이다. 당시 애슬레틱스의 선수 구성 그리고 구단의 투자 대비 성과는 140년 넘는 메이저

리그 역사의 최대의 이변으로 기억되고 있다. 애슬레틱스 성공의 비결은 무엇일까. 단지

우연이었을까. 성공의 비결은 야구계의 인습과 편견을 허문 데이터 분석과 이를 통한 과

학적인 운영 방식에 있었다.

부자 구단들이 거액 연봉으로 스타급 선수들을 대거 영입해 팀의 전력을 키우는 돈의

경기로 전락한 메이저리그. 이런 환경에서 가난한 구단에게 과연 희망이 있을까. 당시

애슬레틱스의 구단주인 빌리 빈의 고민이었다. 그러나 빌리 빈에게는 다른 구단주들이

가지지 못했던, 현상에 현혹되지 않고 본질을 꿰뚫어 보는 통찰력이 있었다. 당시 구단

의 메이저리그 스카우터들이 젊은 선수를 영입할 때 판단 기준은 바로 외양이었다. 스카

우터들의 관심은 대부분 큰 키에 넓은 어깨와 강인해 보이는 인상을 가진 선수들을 향

해 있었다. 또한 야구를 단체 경기로 여기기보다는 개인능력에 따라 성패가 좌우되는 성

향의 스포츠라는 편견에 사로 잡혀 있었다. 즉 좋은 팀을 구성하기 위해서는 개개인의

선수가 우수해야 한다는 선입견이다. 물론 선수의 기량을 판단하기 위해 기본적인 데이

터는 활용되었지만 그마저도 한계가 있었다. 예를 들어 대부분의 구단은 선수를 평가하

는 기준으로 타율이나 방어율처럼 선수 개인의 능력을 평가할 수 있는 데이터를 주로

활용하였고, 그 선수 개인의 역량이 팀 승리에 미치는 상관관계를 파악하는 분석은 거의

Page 3: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

108 ․ 상장협연구 제67호 2013/4

하지 않았다.

과연 이러한 기존의 상식과 방식이 팀 운영 및 의사결정에 도움이 될까. 빌리 빈은 100

년이 넘은 야구계의 편견을 깨기 위해 데이터라는 망치를 집어들었다. 그는 메이저리그

구단 최초로 야구 경력이 전무하고 통계학, 경제학을 공부한 사람을 자신의 보좌관으로

영입한 후, 선수의 개인 자질 중 팀 승리에 기여하는 요소를 파악․분석해냈다. 놀랍게도

이 데이터 분석을 통해 빌리 빈은 기존의 상식과는 다른 결과를 도출해냈다. 선수 개개인

의 신체적 조건이나 운동능력보다는 좋은 공이 올 때까지 기다릴 수 있는 차분하고 끈질

긴 성품과 단순히 높기 만한 타율보다는 투수가 많은 공을 던지게 한 후 출루하는 능력이

팀 승리와 더욱 밀접한 관계가 있다는 사실을 발견했다. 또한 작전야구라는 미명하에 빈

번하게 시도되는 도루나 번트가 기대와는 달리 팀 승리에 크게 기여하지 못한다는 사실도

파악했다. 빌리 빈은 이러한 분석을 바탕으로 선수 영입과 선수 구성에 직접 관여하였고

일반 상식으로는 저평가될 수밖에 없는 선수를 싸게 영입하여 훌륭한 팀을 구성할 수 있

었다. 하버드대학 통계학과의 칼 모리스 교수는 마코브 체인이란 확률 모델을 바탕으로

120년간의 메이저리그 데이터를 분석해 빌리 빈의 통찰력에 상당한 근거가 있음을 학문적

으로 밝혀내기도 했다.

일반적인 상식을 깨는 빌리 빈의 발상과 데이터 분석을 통한 구단운영은 이후 모든

메이저리그 팀의 운영 전략으로 널리 활용된다. 요즘 대부분의 메이저리그 팀은 수학이

나 통계학을 전공한 분석가를 두고 있으며 이들은 직접 팀의 선수기용이나 세부 작전에

까지 관여하고 있다. 나아가 빌리 빈의 성공 스토리는 야구계를 넘어 하버드 비즈니스

스쿨을 비롯한 유수의 경영대학원에서도 성공 사례로 소개되고 있다. 야구는 다른 스포

츠 경기에 비해 많은 데이터가 발생한다. 야구를 데이터의 스포츠이자 과학의 스포츠라

부르는 이유가 여기에 있다. 빌리 빈이 기존 야구계에 팽배했던 편견과 상식의 틀을 깨

고 합리적이며 과학적인 혁신을 이룰 수 있었던 비결도 바로 각 경기당 모든 선수들의

경기력에 관한 세부 데이터였다.

이제 이 이야기를 기업 운영으로 옮겨 생각해보자. 일반 상식이나 리더 개인의 카리스

마로 기업을 운영하던 시대는 급속히 저물고 있다. 이러한 패러다임 변화의 출발점이 바

로 데이터다. 데이터가 없었던 시절에는 사실증명의 근거는 희박했고 결국 경험과 상식

이 운영의 핵심이었다. 그러나 데이터는 모든 것을 바꾸고 있다. 지난 몇 년 사이 급속

히 발전한 IT 인프라와 대용량 데이터베이스의 범용화로 기업은 오히려 이렇게 수많은

데이터를 어떻게 활용해야 할지를 고민하는 급격한 시대변화를 겪고 있다. 데이터는 새

로운 경영 방식을 요구하고 더 나아가 경영의 새로운 패러다임을 창조하고 있다. 폭증하

Page 4: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 109

는 데이터와 고도의 수학 알고리즘을 바탕으로 한 과학적 의사결정을 통해 기업운영을

혁신한 사례가 속속 등장하고 있다. 빅데이터로 인해 새로운 패러다임이 등장한 것이다.

Ⅱ. 빅데이터의 시작

빅데이터란 IT기술과 인터넷 기술이 발달과 함께 폭증하는 데이터를 분석해 새로운

의미를 찾으려는 기술적 의미에서 탄생하였다. 10여 년 전 야후, 구글과 같은 인터넷 검

색엔진 서비스 제공 기업과 대용량 데이터 인프라를 제공하는 IT기업이 기존 데이터와

비교할 수 없이 많은 양의 데이터를 보관, 처리, 분석하는 방식을 고민하며 생긴 기술적

인 용어이기도 하다. 비록 태생은 기술 분야지만 2011년 이후 이 용어는 기술뿐만이 아

니라 사회, 문화, 정치 등을 아우르는 우리 삶의 이슈이자 혁신적 패러다임으로 부각되

었다. 그렇다면 왜 이 기술 중심적 용어가 혁신적 패러다임 이슈로 등자하게 되었을까.

인류탄생의 순간부터 2003년까지 우리 인류가 쌓아 온 데이터의 총량은 약 5엑사바이

트다(위 그림). 그런데 2004년부터는 이 정도 규모의 데이터를 생성하는데 걸리는 시간

이 불과 이틀로 줄어들었다. 데이터 생성량과 쌓이는 규모는 이제 과거와는 비교가 되지

않을 정도다. 규모로만 본다면 새로운 디지털 문명이 이끄는 새로운 세상이라고 해도 과

언이 아니다.

Page 5: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

110 ․ 상장협연구 제67호 2013/4

IT기술 발달로 인해 휴대폰, 태블릿PC 등 개인용 휴대기기의 보급이 늘어났고 이는

또 트위터나 페이스북 등 소셜네트워크 상의 정보량 폭증으로 이어졌다. 그러나 불과 몇

년 전까지만 해도 빅데이터는 학자들 사이에서나 통용되는 용어였고 당시에는 페타바이

트나 제타바이트급의 데이터가 빅데이터라는 식으로 특정 용량에 따라 일반 데이터와

빅데이터를 기술적으로 구별하기 시작했다. 또 한편으로는 기존 데이터베이스 처리방식

으로 데이터를 저장하고 열람하기 어려운 대용량의 데이터를 빅데이터라 칭하기도 했다.

기업에서도 이러한 대용량 데이터를 담아 둘 기술력이 부족했고 담아 둔들 이들 데이터

를 의미 있게 분석할 수 있는 능력이 없었으므로 생성과 동시에 거의 폐기되었다. 그래

서 당시에는 이런 대용량의 데이터 분석은 구글처럼 우수한 인력을 보유하고 있는 소수

기업들의 전유물로만 여겨졌다.

하지만 최근 트렌드가 바뀌기 시작했다. 우선 기업들이 데이터의 가치를 재조명하기

시작했고 한발 더 나아가 전문가가 아니더라도 대용량 데이터를 저장하고 분석할 수 있

는 기술과 환경이 속속 등장하면서 방대한 정보를 수집하고, 분석하는 것이 새로운 가치

로 여겨지기 시작했다.

이러한 새로운 트렌드에 발맞춰 과거 전문가들 사이에서만 통용되던 ‘빅데이터’의 정

의도 확대되고 있다. 특정 용량 이상의 데이터 혹은 기존 데이터베이스 시스템으로는 처

리가 불가능한 양의 데이터를 칭하던 빅데이터의 의미도 기술혁신에 맞춰 다시 정의되

어야 했다. 어제는 처리하지 못했던 용량의 데이터를 새로운 기술을 활용해 내일은 처리

할 수 있게 된다면 어제의 빅데이터가 오늘은 일반데이터가 되는 모순이 발생한다. 이처

럼 나날이 신기술을 선보이는 세상에서 어느 특정 이상의 용량을 구분해 빅데이터와 일

반데이터를 구분 짓는 것은 의미가 없다. 그렇다면 요즘 부각되고 있는 빅데이터의 의미

는 무엇인가. 바로 현대 데이터 시대를 직시하는 새로운 패러다임이 빅데이터가 가지는

의미라고 볼 수 있다.

Ⅲ. 기업의 새로운 경쟁력 빅데이터 애널리틱스

기업의 전유물이었던 빅데이터가 최근 몇 년 전부터 하드웨어 가격 하락과 분석기술

의 발달로 데이터 전문기업뿐만 아니라 다양한 산업의 다양한 기업도 빅데이터의 활용

에 관심을 기울이기 시작했다. 유통사들은 그저 쌓아놓고만 있던 고객의 주문 정보를 분

석하기 시작했고, 카드사들도 고객의 구매 패턴에 관심을 기울이기 시작했다. 교통 물류

기업도 상품의 이동경로와 여행객의 이동경로 데이터가 상당한 사업기회를 줄 수 있다

Page 6: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 111

는 사실을 간파하고 있으며, 광고회사도 개개인의 취향을 파악하면 고도화된 광고전략을

세워 과거에는 상상도 할 수 없었던 효과를 얻을 수 있다는 확신을 갖기에 이르렀다.

빅데이터의 가치를 이야기할 때 빼놓을 수 없는 단어가 바로 애널리틱스(Analytics)다.

애널리틱스를 직역하면 “분석”이 된다. 그러나 일반적 비즈니스 분석과는 달리 여기서

말하는 애널리틱스는 복잡한 연산을 수학적 최적화나 고도의 알고리즘을 통해 실시간으

로 분석해 그 결과를 도출한다는 의미로 통용되고 있다. 엄청난 양의 데이터를 분석하고

이를 활용해 실시간으로 필요한 의사결정을 내리는 작업은 과거 몇 년 전까지만 해도

구글 등 데이터 전문기업들의 전유물이었다. 그러나 컴퓨팅 기술의 발달과 애널리틱스를

활용한 범용 소프트웨어가 출현하면서 특정 데이터 전문기업이 아닌 기업도 데이터를

분석하여 실시간으로 의사결정을 내릴 수 있는 기반이 마련되었다.

2011년 초 MIT 슬론매너지먼트 리뷰에는 빅데이터와 빅데이터를 분석하는 기술인 애

널리틱스가 기업의 경쟁력이 될 것이라는 내용의 커버스토리를 통해 데이터가 단순한

트렌드 분석이나 보고서 작성의 부차적 지원 기능이 아닌 기업의 핵심역량이 될 것이라

는 소개와 함께 경제, 비즈니스의 빅데이터 시대가 시작되었음을 알렸다. 그리고 정책

입안이나 경제성장을 견인할 도구로 빅데이터의 가치가 부각되면서 빅데이터는 이제 기

술 이슈에서 경영, 경제, 안보 등 다양한 분야의 이슈로 확산되기 시작하였다. 더 나아가

인류 역사의 새로운 패러다임으로 등장하기에까지 이르렀다. 빅데이터와 애널리틱스 활

용의 성공적 사례를 글로벌 반도체 기업인 마이크론 테크놀로지(Micron Technology)에

서 찾을 수 있다.

반도체 제조는 수백 개의 공정으로 이뤄지기 때문에 반도체 제조 설비는 인간이 창조

한 가장 복잡한 설비 중의 하나로 여겨지곤 한다. 특히 반도체를 생산하는 설비와 기계

는 대당 수십억에서 수백억에 이르는 고가로 이들의 생산 효율이 전체 반도체 생산 경

쟁력을 좌우한다. 그리고 각 장비에서 1초마다 생성되는 데이터의 양은 대형 포털사이트

에서 생성되는 검색어 데이터의 양과 비교할 수 있을 정도다. 마이크론은 이러한 빅데이

터를 바탕으로 각 장비의 효율성과 공장 전체 운영의 최적화를 구현하는 프로젝트를 실

행했다.

통상적으로 각 장비 혹은 기계의 생산성은 단위 시간당 얼마나 많은 제품을 생산했는

가를 따져 판단한다. 그러나 마이크론 경영진은 업계에 통용되어 온 이 평가 방식이 과

연 옳은 것인지에 대한 질문을 가졌다. 물론 상식적으로는 공장 내 모든 기계들이 저마

다 일정량 이상의 기대효율로 제품을 생산하고 있다면 전체 공장의 생산성도 같이 높아

진다고 생각할 수 있다. 이는 마치 야구에서 개인 타율이 높은 선수만 모아놓으면 좋은

Page 7: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

112 ․ 상장협연구 제67호 2013/4

성적을 낼 수 있으리란 기대와 같다. 하지만 마이크론의 경영진은 생산성 높은 기계들만

갖춰 놓으면 생산성 높은 공장이 될 수 있는지 스스로에게 질문을 던져보았다. 그리고

이 질문에 답하기 위해 각각의 설비, 기계에서 생성되는 수많은 데이터의 패턴을 분석하

기 시작했고 그 결과는 장비의 높은 생산성이 반드시 전체 공장 생산성을 보장하지는

않는다는 것이었다. 원인은 공장 내 물류 흐름과 기계, 설비의 유지보수 작업이 서로 엇

박자를 내고 있었기 때문이었다.

반도체 제조에 필요한 일부 핵심 장비는 특성상 하루에 몇 번이고 기계 가동을 잠시

중단하고 유지 보수를 위한 점검을 실시해야 한다. 수요가 적어 생산해야 할 물량이 적

을 경우 장비의 유지보수를 실시하고 반대로 생산해야 할 물량이 많을 경우에는 유지보

수를 잠시 미루고 장비를 계속 가동하는 것이 이상적인 운영이다. 그러나 실제 생성되는

대량의 데이터 패턴을 분석해 본 결과 물량이 많은 시점에 장비 가동을 중단하고 유지

보수 작업을 실시하는 경우가 종종 있다는 사실을 발견했다. 이러한 발견은 장비의 작동

현황, 공장 내 생산 물량과 그 이동, 그리고 장비의 유지 보수 시점 등을 종합적으로 검

토해야 파악할 수 있는 문제로 단순히 장비의 생산 효율만으로는 판단하기 힘든 것이었

다. 마치 야구에서 타자 개개인의 타율만으로 팀 기여도를 판별하기 어려운 경우와 비슷

하다. 실제 팀 기여도를 판별하기 위해서는 득점권 타율과 진루타, 희생타 등 경기흐름

과의 상관관계와 승리공헌도 등이 타자의 능력과 복합적으로 분석되어야 타자의 진정한

팀 기여도를 분석할 수 있는 것과 같다. 이러한 발견을 바탕으로 마이크론사는 수학의

스케줄링 이론을 이용해 어느 시점에서 어떤 기계의 유지보수 작업을 실시해야 하는지

를 결정하는 의사결정 시스템을 구축했다. 빅데이터 분석으로 비효율적 패턴을 감지하

고, 이를 보완하기 위해 실시간으로 데이터 분석을 통해 실시간으로 의사결정을 내리는

빅데이터, 애널리틱스 시스템을 구현해 낸 것이다. 이는 공장 전체 생산성 향상이란 결

과로 이어졌다. 과거 쌓아두기만 하던 데이터를 적극적으로 분석하여 기업의 경쟁력으로

승화시킨 결과이자 데이터와 애널리틱스를 결합하여 생산 공정을 과학적으로 혁신한 사

례다. 이후 마이크론사는 모든 기계와 공장 운영 그리고 제품이 소비자에게 전달되는 유

통망 데이터까지 모두 연계해 종합적으로 분석한 결과를 토대로 다시 문제를 분석하고

의사결정을 내리는 과학적 기법을 기본 경영의 틀로 활용하고 있다.

위 사례는 과거 필자가 근무했던 글로벌 반도체기업 마이크론 테크놀로지에서 2008년

실제 수행한 프로젝트다. 마이크론사는 빅데이터 분석을 통해 얻은 비용절감 효과를 약

3천만 달러로 추산하고 있다. 이제 비즈니스 운영의 거의 모든 면에서 다양한 데이터가

축적되고 있다. 버려지던 데이터가 이제는 기업에 새로운 기회를 제공하고 있다. 데이터

를 쓰레기로 만들지 황금알을 낳는 거위로 만들지를 결정하는 것은 기업의 몫이다.

Page 8: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 113

Ⅳ. 빅데이터와 애널리틱스

위 사례는 빅데이터의 가치와 빅데이터 활용 방식을 잘 설명해 준다. 과거 충분한 데

이터가 없던 시절에는 없는 데이터라도 모아서 그 데이터로 무엇을 할 수 있는지 판단

하는 식으로 데이터 분석이 이뤄졌다. 고전 통계의 생성과정을 살펴보면 이러한 과거 데

이터가 없던 시절의 니즈를 파악할 수 있다. 제한된 정보를 통해 전체를 유추하거나 한

정된 데이터를 바탕으로 본질을 파악하자는 것이 바로 고전 통계의 핵심이다. 일종의 샘

플링이다. 데이터를 구하기 힘들거나 구할 수 있어도 많은 노력과 비용이 들었던 시절에

는 제한된 정보를 바탕으로 전체를 유추하는 방식이 필요했고 이러한 요구에 부응하기

위해 통계라는 수학적 방식이 탄생하게 되었다. 즉 통계는 ‘충분하지 않은 데이터’라는

가정을 전제하고 있다. 그러나 빅데이터 시대는 데이터를 수집하고 정보를 모으기 위해

필요한 비용이 급격히 감소하고 있다. 이제 데이터가 없어서 문제를 해결하지 못하는 시

대는 저물고 있다. 데이터의 양이 아니라 데이터를 의미 있게 분석해내는 능력이 관건이

다. 데이터에서 의미를 찾아 이를 지식이나 지혜로 발전시키는 통로 역할을 하는 것이

바로 애널리틱스다. 대용량 데이터 분석을 통해 과거 발견하지 못했던 본질을 파악하거

나 문제를 해결하는 것이 바로 애널리틱스의 핵심이다.

빅데이터 시대가 요구하는 또 다른 애널리틱스의 가치는 바로 결과 중심적 분석이다.

과거 데이터 분석 결과물의 형식은 대부분 분석 리포트였다. 기업의 데이터 분석은 수치

를 정리하고 이를 바탕으로 어떤 방식의 결론을 추론해 리포트 형식으로 정리하는 것이

대부분이었다. 리포트의 결과를 바탕으로 어떤 의사결정이나 행동을 취할지는 리포트 작

성과는 분절된 이슈였다. 데이터를 분석해 리포트를 정리하는 조직과 리포트를 바탕으로

계획을 실행에 옮기는 조직이 나뉘어져 있었다. 분석과 실행이 따로 이뤄지다보니 분석

데이터가 구체적인 결과로 이어지는 경우가 드물거나 그 효과가 미미했다. 이와 같은 예

는 고객 관계 분석(CRM)의 사례를 통해 파악할 수 있다. 과거 10여 년 전 CRM이 마케

팅의 큰 화두중 하나로 떠오를 당시 많은 솔루션 기업들이 SCM관련 분석 툴을 시장에

선보였었다. 이들 솔루션은 기업 고객들의 구매정보나 회원카드 개인정보 등 다양한 데

이터를 바탕으로 고객을 여러 군으로 나눌 수 있는 분석 툴을 제공하였다. 하지만 고객

군을 분류한 결과가 담아진 리포트가 있다 한들 이를 바탕으로 차별화된 고객 서비스를

제공하는 방식과 행동이 구체화되지 못하면 아무 소용이 없다. CRM의 진정한 가치는

단지 데이터를 바탕으로 고객을 분류하는 것이 아닌 분류된 고객군별로 필요한 제품과

Page 9: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

114 ․ 상장협연구 제67호 2013/4

서비스를 제공해 매출과 고객 만족도룰 높이는 것이다. 단지 고객분류에만 CRM툴을 활

용하면 훌륭한 리포트는 얻을 수 있을지언정 진정한 매출 상승이나 고객만족을 실현하

는 데는 한계가 있다.

그러나 빅데이터 패러다임에서는 이러한 과거 데이터 분석의 한계를 극복한 솔루션이

속속 등장하고 있다. 좋은 예가 바로 아마존닷컴(Amazon.com)의 개인화 쿠폰이다. 세계

최대의 리테일러인 아마존닷컴은 회원들 개개인의 구매 패턴을 파악한 후 자동화된 알

고리즘으로 개인에 맞는 쿠폰을 생성하여 고객에게 전달한다. 예를 들어 유아용 세발자

전거를 구매한 고객의 대부분이 세발자전거의 안장벨트를 함께 구매하거나 자전거를 구

매한 후 얼마 지나지 않아 안장벨트를 구매한다는 패턴을 구매 데이터로 파악했다면, 세

발자전거를 구매했지만 어느 기간 동안 안장벨트를 구매하지 않은 고객을 대상으로 안

장 할인쿠폰을 발행하는 것이다. 물론 구매 패턴 파악과 고객 선별 그리고 쿠폰 발송 등

은 빅데이터 분석과 함께 수학적 알고리즘 즉 애널리틱스로 함께 연동된다. 이와 같이

과거 데이터 분석의 패러다임에서는 고객을 분류, 파악해 리포트로 작성, 제공하는 것이

최종 목표였다면, 빅데이터 패러다임에서는 그 분석이 애널리틱스에서 제공하는 수학적

알고리즘을 통한 의사결정과 맞물려 쿠폰 발송과 같은 실제적인 마케팅 기법으로 진행

된다. 아마존닷컴 뿐만 아니라 미국 최대의 호텔기업인 메리어트의 호텔 숙박비 실시간

자동산정 시스템, DVD 렌털 기업인 넷플릭스의 고객 취향에 맞는 영화추천이 이들 범

주에 속한다. 그리고 이들 기업의 또 다른 공통점은 빅데이터와 애널리틱스의 결합으로

경쟁업체와 차별화된 서비스를 제공함으로써 기업 경쟁력 강화에 성공했다는 점이다. 이

처럼 빅데이터의 진정한 가치는 애널리틱스 통해 구현되고 그 가치는 기업의 강력한 무

기로 변모할 수 있다.

아래 그림은 과거 데이터 분석과 현재 빅데이터 분석의 차이를 설명해준다. 과거 데이

터가 부족하거나 데이터 취합에 많은 비용이 요구되었을 때는 일단 가능한 데이터부터

취합하는 것이 데이터분석의 첫 번째 작업방식이었다. 그리고 그 대부분은 과거 트렌드

분석이었다. 데이터가 생성되던 시점과 데이터를 취합할 수 있는 시점의 시차가 존재했

기 때문에 실시간 파악은 불가능했고 과거 어떤 상황이 일어난 후에나 데이터를 취합할

수 있었기 때문에 이러한 시차를 극복하기는 불가능했다. 그래서 대부분의 데이터 분석

은 과거에 어떤 일이 있었는지를 판별하는 것이었다. 데이터 분석의 결과물은 리포트의

형식을 취했다. 이 리포트를 바탕으로 어떤 실행을 하느냐는 데이터 분석과는 분리된 프

로세스였다.

하지만 빅데이터 시대에는 데이터 분석 자체의 프로세스와 결과 및 진행 사항이 변모

Page 10: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 115

하고 있다. 우선 원하는 데이터는 모두 취합할 수 있기 때문에 데이터 그 자체의 가치는

하락하고 있는 대신 어떤 의사결정이 이뤄져야하는지 파악이 되면 이후에 이를 위해 데

이터 수집이 이뤄진다. 즉 데이터의 가치는 어떤 결과를 도출하고 어떤 의사결정을 내릴

것인가에 따라 결정된다는 것이다. 이처럼 어떤 목적을 추구하느냐와 애널리틱스의 품질

에 따라 데이터의 가치가 결정된다.

Ⅴ. 빅데이터의 새로운 패러다임

빅데이터는 단순한 기술 진보나 IT트렌드만을 뜻하는 것이 아니다. 인류의 전 진화과

정을 통해 알 수 있듯 인간의 의사결정에 필요한 정보나 데이터는 언제나 부족했다. 설

사 데이터가 있더라도 실시간으로 바로 취합해 이를 의사결정에 바로 사용하는 것은 불

가능했다. 그러나 컴퓨팅 기기와 진보된 IT인프라 및 스마트폰의 보편화를 통해 인류는

이러한 한계를 극복하고 있다. 이제 손안의 컴퓨터인 스마트폰으로 필요한 정보를 언제

든지 쉽게 수집하고 이를 바탕으로 의사결정을 내릴 수 있는 시대다. 이는 기존의 의사

결정과정, 즉 좋은 판단을 내리기 위한 정보가 부족한 상황 하에서의 의사결정 시대에서

좋은 의사결정에 필요한 충분한 데이터를 즉시 구할 수 있는 시대로 진행하고 있다. 이

런 새로운 비즈니스의 패러다임을 가장 효과적으로 경영에 적용한 기업이 바로 패션브

랜드 ‘자라(Zara)’다.

스페인에서 첫 매장을 오픈한 후 점차 유럽 패션의 본거지인 밀라노와 파리에 성공적

으로 입성하더니 작년 3월에는 세계 패션의 메카인 뉴욕 5번가의 빌딩을 미국 부동산

최대 매매가인 3억 2천만 달러에 매입하며 세계 패션계를 놀라게 했다. 일반 패션 브랜

Page 11: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

116 ․ 상장협연구 제67호 2013/4

드의 경우 한 시즌 판매할 상품들을 6개월에서 길게는 1년 전 부터 기획하여 디자인, 생

산, 유통을 거친 후 매장에 진열한다. 즉 매장에 진열된 상품은 6개월에서 1년 전 기획

된 상품이라 할 수 있다. 그러나 요즘처럼 하루가 다르게 유행이 바뀌는 시대에 1년 전

기획된 상품은 이미 한물간 퇴물이 되기 일쑤다. 자라는 유행에 따른 트랜디 상품을 장

기 기획 방식이 아니라 현재 유행을 신속하게 포착해 불과 몇 주 내에 기획, 디자인, 생

산, 매장 진열까지의 과정을 완성하는 초스피드 공급 방식으로 운영한다. 또한 다양한

트랜디 상품의 수요를 충족시키기 위해 다품종 소량 생산 방식을 택했다. 일반 패션 브

랜드의 경우 시즌 당 약 3천 종류의 상품을 선보이는 것에 비해 자라는 무려 1만1천 종

류의 상품을 선보인다. 다품종 소량 생산 그리고 시장에 대응하는 신속한 생산은 상당한

비용이 요구되는 전략인데, 오히려 자라는 이런 생산 전략으로도 저가의 상품을 생산해

낸다. 비결이 무엇일까. 바로 빅데이터와 애널리틱스다.

최대의 매출을 창출할 수 있는 알고리즘을 이용한 애널리틱스 방식을 개발해 상품 수

요 예측, 각 매장별 적정 재고 산출, 그리고 최적화한 상품별 가격 결정 등 현장 운영에

활용하고 있다. 전 세계 매장에서 본사로 시시각각 유입되는 판매 데이터를 바탕으로 수

학의 최적화 알고리즘을 이용해 어떤 시점에 어떤 상품이 어떤 매장에 진열되어야 하는

지를 실시간으로 분석한다. 한때는 슈퍼컴퓨터의 연산 처리를 제어하거나 우주 왕복선의

운영에만 제한적으로 적용되던 첨단 수학분석 방식이 패션업계에 적용되어 새로운 성공

적인 비즈니스 모델을 창출한 것이다. 자라는 미국 MIT공대와 함께 지난 수년간 빅데이

터 분석과 첨단의 수학적 분석을 자라 운영에 적용하는 연구를 수행했고 이미 이와 관

련된 다수의 석사와 박사 논문이 발표되었다.

그렇다면 자라의 새로운 운영 패러다임의 의미는 과연 무엇일까. 다름 아닌 빅데이터

를 이용한 새로운 운영방식의 개발이다. 자라의 경쟁업체들인 타 패션 브랜드들도 자라

와 마찬가지로 수많은 매장에서 실시간 데이터를 수집해 이를 운영의 의사결정에 활용

하는 방안을 모색하고 있다. 그러나 자라를 제외한 타 업체들은 기존 운영방식을 고수한

채 빅데이터 분석을 기존의 의사결정 방식에 끼워 맞추려고만 하였다. 일반적인 패션업

계 운영에서는 기획에서 판매까지 1년의 기간이 걸린다. 자라를 제외한 많은 기업들은

나날이 쌓여만 가는 다양한 데이터로 1년 후 패션 트렌드를 예측하는 데만 사용하였지

이를 활용해 운영을 혁신하는 데까지는 생각의 깊이가 닿지 못했다. 물론 좀 더 많은 데

이터가 있으면 미래를 조금 더 정확하게 예측할 수 있지만 아무리 데이터가 많아도 1년

후 트렌드를 예측한다는 것은 거의 불가능하다. 대신 현장에서 실시간으로 유입되는 방

대한 데이터 즉 빅데이터 패러다임에서는 미래보다 현재의 상황을 실시간으로 바로 수

집․분석하여 ‘현재 무엇이 일어나는가?’라는 대답에 정확한 답을 제시할 수 있다. 자라

Page 12: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

빅데이터의 활용

상장협연구 제67호 2013/4 ․ 117

와 MIT팀은 빅데이터를 이용해 효용 없는 1년 후의 미래를 예측하기 보다는 실시간으

로 현장 상황을 파악하여 그 정보를 활용하는 방식을 고민하기 시작했고 이를 통해 적

시 제조란 새로운 혁신적인 운영방식을 고안해 낸 것이다. 즉 정보가 많으면 미래의 시

장을 좀 더 정확하게 예측할 수 있을 것이라는 과거 고리타분한 데이터 활용 방식보다

는 현장을 정확하게 파악하여 실시간으로 필요한 의사결정을 내리는 방식을 추구하였고

이를 바탕으로 모든 운영을 혁신하였다.

자라의 또 다른 빅데이터 활용 패러다임 혁신은 실시간 의사결정에 있다. 자라는 실시

간으로 유입된 재고현황, 매출정보, 고객정보를 활용해 특정 매장에 특정 상품의 재고가

바닥날 경우 언제, 어디의 물류센터에서 출고 되어야 할지 최적화된 수학 알고리즘을 활

용한 애널리틱스를 통해 결정한다. 빅데이터 분석을 통해 현황 파악만 하던 수준에서 바

로 의사결정을 내리는 단계로 진화한 것이다. 자라는 의사결정과 실행이라는 고리를 빅

데이터 애널리틱스를 통해 연결함으로서 빅데이터의 새로운 패러다임을 실현한 것이다.

이제 의사결정에 필요한 대부분의 정보가 취합 가능한 세상이 되었다. 거리의 CCTV

는 실시간으로 보행자의 정보를 취합하고 있고, 자동차에 달린 블랙박스는 실시간으로

운전자가 보고 있는 운전정보를 수집하고 있다. 많은 사람들의 사소한 잡담도 SNS라는

틀을 통해 데이터로 축적되는 세상이다. 개인 프라이버시 이슈만 고려하지 않는다면 원

하는 데이터를 한 곳으로 취합해 활용하는 데 큰 기술적 제약이 없는 세상이 되고 있다.

이제는 의사결정에 필요한 정보가 부족하다는 가정, 즉 과거 의사결정의 한계를 수정할

때가 왔다. 이제는 반대로 원하면 얼마든지 원하는 정보를 취합할 수 있다는 새로운 가

정이 바로 빅데이터가 창조한 새로운 의사결정 패러다임이다. 이제 더 나은 의사결정에

필요한 것은 데이터가 아닌 이 방대한 데이터를 바탕으로 한 실시간 의사결정과 실행이

다. 이러한 의사결정의 새로운 패러다임은 기업의 빅데이터 활용 첫 번째 과제이자 가장

중요한 핵심이다.

Page 13: @AB CD · 2015-08-24 · T ' ^!åI9: à ã9 ÅC ³^å`I/9ÅHâã9 t^ {*[ 55Åî»ð¯`®*#ñ^»:6jm^ +¥y6 {¥+O 7#+N îØjq^»ðzo7 r ò.¦ V ST U Y6 ò.¦ #° I/Q

시사논단

118 ․ 상장협연구 제67호 2013/4

〈참 고 문 헌〉

Michael Lewis, Money Ball, The art of winning unfair game, W. W. Northon and

Company, 2003.

Alan Schwarz, “Managing with Markov”, Harvard Magazine, May, January, 2022,

pp.34-35.

OMOR Today, “Analytics & Sports”, March/April, 2012, pp. 22-26.

장영재, <경영학 콘서트>, 비즈니스북스, 2010.

Deloitte Consulting, 2012.

The Magazine - MIT Sloan Management Review, Winter 2011, Big Data, Analytics

Big Data, Analytics and the Path From Insights to Value

Bloomberg, http://www.bloomberg.com/news/2011-03-04/zara-parent-inditex-pays-

324-million-for-fifth-avenue-store-in-manhattan.html

Andrew McAfee et al., Harvard Business School Case N0.608-081: “Zara: IT for Fast

Fashion”

Felipe Caro and Jérémie Gallien, “Zara Uses Operations Research to Reengineer Its

Global Distribution Process”, Interfaces, Vol. 40, No. 1, Jan-Feb 2010, pp.71-

84.