14
SAS® High-Performance Analytics 분석 결과의 질과 속도 개선은 과연 우리에게 어떤 혜택을 안겨줄 것인가? 조직 변혁을 통한 경쟁력 우위 확보

빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

Embed Size (px)

Citation preview

Page 1: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

SAS® High-Performance Analytics 분석 결과의 질과 속도 개선은 과연 우리에게 어떤 혜택을 안겨줄 것인가?

조직 변혁을 통한 경쟁력 우위 확보

Page 2: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

백서 요약

기업들은 지속적으로 효과적인 의사결정 기법을 모색하는 동시에 대용량

데이터에서 도출된 팩트에 점점 더 의존하는데, 분석하고자 하는 데이터는

기하급수적으로 증가하고 있다. 소셜 미디어, (소비자) 심리 지수, 웹 로그,

센서 데이터, 거래 데이터, 제3자 데이터, 기타 빅 데이터 소스 … 그 항목

을 일일이 열거하기가 힘들 정도다. 동시에, 사실적 정보에 근거한 의사결

정을 보다 효과적이고 신속하게 내려야 한다는 압박감이 그 어느 때보다

심하게 조직들을 짓누르고 있다.

복잡성과 빈도가 서로 다른 의사결정을 매일 수백, 수천 건씩 내려야 하는

상황에서 새로운 요구사항을 모두 충족하는 일이 과연 가능할까? 의사결

정을 내리기 전에 다양한 What-If 시나리오를 검토하느라 수일 또는 수주

씩 기다릴 여유가 없다. 의사결정은 짧은 시간에 즉, 수분 또는 수시간 내

에 이루어져야 하기 때문이다.

SAS® High-Performance Analytics는 이 모든 문제를 해결해줌으로써 당

신을 성공의 지름길로 인도한다. 즉, 고성능 분석 기술이 보통 수시간 내지

수일이 걸리던 복잡한 작업들을 경제적이면서도 확장성이 높은 복수의 프

로세서들에 분산시킴으로써 수십억 건의 데이터 레코드—수백, 심지어 수

천 개의 입력 변수가 포함되어 있는—의 처리 시간을 획기적으로 단축시

켜 준다. 단순히 빠른 시간 내에 분석 작업이 수행되는 것으로 생각해서는

안 된다. 지금 우리는 몇 시간, 며칠이 아니라 몇 초, 몇 분을 얘기하고 있

는 것이다.

본 백서는 SAS와 EMC Greenplum/Teradata가 공동으로 제공하는 신 솔루

션 SAS High-Performance Analytics의 도입 효과에 대해 다루고 있다. 그

내용을 간단히 요약해보면 다음과 같다.

• 모델 구상에서 배치에 이르는 프로세스 소요 시간을 크게 단축함으로써

급변하는 시장 여건에 보다 신속히 대처할 수 있고, 이를 바탕으로 조직은

차별화 전략을 성공적으로 구사하고 혁신을 달성할 수 있다.

• 새롭고 다양한 변수를 더 많이, 그리고 더 신속하게 모델링 프로세스에

통합할 수 있다. 또한 빅 데이터를 활용해서 가치 창출을 극대화하고 강력

한 경쟁력 우위를 확보할 수 있다.

• 복수의 시나리오를 신속하게 테스트하고, 중대 의사결정—업계의 판도를

바꾸어 놓을 만한—을 내리는 데 필요한 최적의 권고사항을 정확하게 제

시한다.

1

효율성 높은 분석 결과물은 지금까지 불가능한 것으로 여겨졌던 일들을 처리할 수 있게 해주며, 빠른 결과 도출은 경쟁업체들을 압도하고 시장 변화의 이점을 적극 활용할 수 있게 해준다.

SAS White Paper

Page 3: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

“우리는 혁신적인 성능 개선을 원했다. 이것이 가능하다면 우리 고객들은 그들의 업무/비즈니스 방식을 획기적으로 변화시킬 수 있게 될 것이다.”

Oliver Schabenberger -

SAS 하이 퍼포먼스 분석 담당 수석 아키텍트

이 같이 빠르고 정확하게 도출된 분석 결과물은 우리에게 어떤 이점을 안

겨줄 것인가? 본 백서에는 SAS High-Performance Analytics가 (데이터베

이스 어플라이언스에서) 어떻게 작동하며 조직 차원에서 어떤 도입 효과가

있는 지 자세히 기술하고 있다. 또한 유스 케이스(Use-Case) 시나리오를

통해서 독자들은 여러 업종의 조직들이 획기적인 분석 기법을 활용해 어

떻게 시장을 주도해 나가고 경쟁 우위를 달성하는지 살펴볼 수 있다.

효율성 높은 분석 결과물은 지금까지 불가능한 것으로 여겨졌던 일들을

처리할 수 있게 해주며, 빠른 결과 도출은 경쟁업체들을 압도하고 시장 변

화의 이점을 적극 활용할 수 있게 해준다.

아주 단시간에 심도 깊은 통찰력을 도출해낼 수 있다면?

당신이 소매업자라고 가정해보자. 통상적으로 가격을 책정하는 데 30시간

정도가 걸린다. 하지만 단 두 시간 만에 최적의 가격 포인트를 찾아낼 수

있다면 당신의 비즈니스에 어떤 변화가 일어날까? SAS High-Performance

Analytics는 수백만 건의 가격 결정 시나리오를 고속으로 실행함으로써 매

장별 재고 처리와 수익 마진 증가 같은 문제를 해결하며, 심지어 경쟁 우위

까지 달성할 수 있게 해준다.

당신이 대규모 투자 금융회사에 근무하고 있는데, 엄청나게 빠른 속도로

전체 리스크 포트폴리오를 재계산해야 한다고 가정해보자. 이 때, 작업 시

간을 18시간에서 12분으로 단축시킬 수 있다면 어떤 일이 벌어질까? 아마

도 익스포주어, 포트폴리오 VaR(Value at Risk), 유동성 커버리지 등을 즉

각 파악하여 어떤 상품을 시장에 선보이고 철수시킬 지에 대해 신속한 의

사결정을 내릴 수 있게 될 것이다. 또한, 작업 속도의 가속화와 민첩성 덕

분에 급변하는 금리, 환율, 거래 상대 등의 리스크에 대한 대처 방법을 보

다 정밀하게 조정할 수 있을 것이고, 이는 곧 경쟁력 우위 획득으로 이어질

것이다.

2

High-Performance Risk

Page 4: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

SAS의 하이 퍼포먼스 분석 담당 수석 아키텍트인 Oliver Schabenberger에

따르면, 이것은 조직들이 업무 처리 속도를 조금이라도 더 개선하고자 애

쓰는 여러 유형의 문제들 중 극히 일부에 지나지 않는다고 한다. “우리 고

객들은 많은 시간이 소요되는 분석 처리 문제를 해결하기 위해 우리를 찾

는다. 작업 소요 시간은 30시간, 10시간, 5시간 등으로 다양했는데, 우리는

이를 더 빠르게 처리할 수 있어야 했다. 하지만 우리는 단순히 속도를 두

배로 높이는 정도에 만족하지 않고 혁신적인 성능 개선을 실현하기를 원

했고, 이렇게 하면 우리 고객들은 그들의 업무/비즈니스 방식을 획기적으

로 변화시킬 수 있다. 즉, 작업 처리 시간이 며칠에서 몇 시간, 몇 시간에서

몇 초로 단축되면 조직들의 일상적인 업무 수행 방식까지도 획기적으로

개선될 수 있는 것이다.”

금융 서비스 회사가 포트폴리오의 리스크를 평가하는 데 2~3일이 걸린다

면 이미 경쟁에서 뒤처져 있는 것이다. 하지만 이 리스크 평가 작업을 단

하루 만에 마칠 수 있다면 비즈니스에 어떤 변화가 일어날까?

각 매장과 고객 프로파일에 대한 할인가와 조정가를 재계산하기 위해 주

말 내내 시간을 허비해야 하는 소매업체라면 수익 신장을 기대하기는커녕

적시에 신상품을 들여놓는 것조차 어려움을 겪을 것이 뻔하다. 하지만 계

산 시간을 몇 시간 단축시킬 수 있다면, 운영 리스크를 획기적으로 줄일 수

있을 것이다.

분석 모델을 생성하고 대용량 데이터를 기초로 모델을 실행하는 일이 많

은 시간이 소요되는 반복 프로세스라는 사실을 분석가라면 누구나 알고

있다. 하지만 이 프로세스의 속도를 더 높일 수 있다면 그만큼 실행할 수

있는 반복 작업의 수도 늘어나 분석 작업의 정확도는 더 향상된다. 하이 퍼

포먼스 기능은 분석가가 앞으로 되돌아가서 모델을 재검토할 수 있는 기

회를 제공한다. 이 때, 분석가는 다음과 같이 자문할 수 있다. “더 낳은 결

과물을 산출할 수는 없었을까? 이 모델을 개선할 방법은 없었었는가? 다른

변수를 넣거나 뺐다면 어떤 결과가 나왔을까?” 매 작업마다 많은 시간이

허비된다면 과연 이런 질문을 던져볼 여유가 생기겠는가. 하지만 분석 처

리 시간을 획기적으로 단축하고 10시간 걸리던 작업을 단 50초 만에 완료

할 경우 상황은 달라진다. 분석가는 모델을 개선하는 데 더 많은 시간을 할

애할 수 있게 되는 것이다.

3

분석 모델을 생성하고 대용량 데이터를 기초로 모델을 실행하는 일이 많은 시간이 소요되는 반복 프로세스라는 사실을 분석가라면 누구나 알고 있다. 하지만 이 프로세스의 속도를 더 높일 수 있다면 그만큼 실행할 수 있는 반복 작업의 수도 늘어나 분석 작업의 정확도는 더 향상된다.

SAS White Paper

Page 5: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

이렇게 보다 효과적이고 빠르게 의사결정을 내릴 수 있음에도 불구하고 여러분은 왜 전통 방식의 소극적인 의사결정에만 안주하려 드는가?

SAS High-Performance Analytics는 또한 수분 내에—수시간이 아니라—복잡한 문제를 해결하고 분석적 통찰을 도출할 수 있게 해준다. 사용자는 데이터의 일부분이 아닌 전체를 마음껏 활용해 복수의 시나리오를 생성, 탐구, 모델링할 수 있으므로 작업의 정확도가 향상되고 의사결정을 획기적으로 개선할 수 있다.

또한, 중요 정보를 생성하기 위한 처리 시간을 줄이면 새로운 질문을 제기하고 이에 답하는 데 여분의 시간을 활용할 수 있다. 새로운 질문은 새로운 아이디어를 유도해내고, 새로운 아이디어는 진정한 의미의 혁신 구현을 촉진하고, 이는 궁극적으로 비즈니스 전반을 변혁시키는 결과를 낳는다. 이렇게 보다 효과적이고 빠르게 의사결정을 내릴 수 있음에도 불구하고 여러분은 왜 전통 방식의 소극적인 의사결정에만 안주하려 드는가?

SAS® High-Performance Analytics는 어떤 솔루션인가?

확장성이 뛰어난 인-메모리 분산 아키텍처를 지원하는 일련의 분석 기능이 포함되어 있는 SAS High-Performance Analytics 솔루션은 종래에는 다루기 어려웠던 대용량 데이터를 활용해 복수의 시나리오를 생성, 탐구, 모델링하고, 고도의 분석 알고리즘을 매우 빠르게 처리할 수 있도록 해준다. 이 두 가지 강점 덕분에 의사결정자는 보다 신속하게 양질의 해법을 얻을 수 있다.

하이 퍼포먼스 SAS 소프트웨어와 데이터베이스 어플라이언스—고급 분석 계산을 위해 특별히 설계되고 최적의 상태로 튜닝된—의 결합이 확장성과 신뢰성을 두루 갖춘 분석 인프라의 역할을 수행해주므로 조직은 다음과 같은 성과를 얻을 수 있다.

• 대용량 데이터에 고급 분석 알고리즘을 다양하게 적용해 난제를 해결할 수 있다.

• 분초를 다투는 중대 의사결정을 위해 매우 신속하게 통찰을 도출해낸다.

• 보다 신속하고 확실하게 상황 대처를 함으로써 신규 기회 포착, 리스크 관리, 최적의 의사결정에 의한 경쟁 우위 선점 등이 가능해진다.

4

SAS® High-Performance Analytics

Page 6: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

솔루션의 작동 원리

SAS High-Performance Analytics는 대용량 데이터와 복잡한 알고리즘 계산을 더욱 빠르게 처리할 수 있게 해주는 어플라이언스 지원 소프트웨어로, SAS의 데이터베이스 파트너들(EMC Greenplum, Teradata)이 제공하는 특정 하드웨어에 설치되어 분산 컴퓨팅 환경에서, 인-메모리 프로세싱 리소스를 사용하여, 복잡한 분석 작업을 처리하도록 설계되었다.

데이터베이스 소프트웨어와 SAS High-Performance Analytics 소프트웨어는 데이터베이스 어플라이언스에 탑재되며, 이 때 최적의 성능 구현을 위해 분석 처리 전용 어플라이언스의 메모리로 데이터를 불러와서 배치한다. 데이터가 데이터베이스에 로컬로 저장되기 때문에 향후 분석에 사용할 데이터를 아주 빠르게 메모리로 다시 불러올 수 있고, 이로써 SAS Analytics의 대규모 병렬 컴퓨팅이 가능하게 된다. 현재 하이 퍼포먼스를 지원하는 SAS 제품에는 Base SAS, SAS/STAT®(하이 퍼포먼스 통계 분석용), SAS/ETS®(하이 퍼포먼스 계량경제 및 시계열 예측용), SAS® Enterprise Miner™(하이 퍼포먼스 데이터 마이닝용) 등이 있다.

솔루션 도입 효과

SAS는 정교한 분석 기술을 활용해서 고객들의 가장 까다로운 문제를 해결해 왔으며, 데이터가 증가하더라도 고객 측에서 분석 작업 수행 방식을 그대로 유지할 수 있도록 최대한 배려하고 있다. 즉, 처리할 데이터가 많다고 하더라도 SAS는 절대 “얼렁뚱땅” 넘어가는 법이 없다.

SAS의 CEO, Jim Goodnight은 이렇게 얘기한다. “실제로 우리는 다른 길을 선택하고자 한다. 우리 고객들이 보유하는 데이터의 양이 늘어난다면 그만큼 더 흥미로운 질문이 제기될 것이다. 우리가 SAS High-Performance Analytics를 통해 복잡한 분석 작업을 초단시간에 처리할 수 있었다는 사실은 비즈니스 차원에서 매우 특별한 의미를 지닌다. 한번에 기껏해야 2~3백 건의 데이터에 대한 분석 작업을 수행했지만, 이제는 수백억 건의 데이터에 대한 분석 프로세스를 수행할 수 있다. 또, 과거에는 기껏해야 5~10개의 변수를 적용해서 수행하던 분석 작업에 이제는 수백, 수천 개의 변수를 적용할 수 있게 되었다. 우리는 고객들이 바로 이런 일을 할 수 있도록 지원하고자 하며, 고객이 신속하게 분석 작업을 수행함으로써 숨겨진 가치를 더 쉽고 빠르게 찾아낼 수 있기를 원한다. 또한, 우리 SAS는 비즈니스 문제를 다루는 조직들의 고정 관념을 바꾸어 놓고자 한다.”

Goodnight과 Schabenberger에 의하면, 관건은 애플리케이션이 최대한 데이터에 근접할 수 있게 하는 것이고, 이렇게 하면 데이터 수집/분석, 변수 선택, 모델링, 모델 평가 등 반복적인 비즈니스 프로세스의 속도를 개선할 수 있다. SAS High-Performance Analytics는 이러한 반복 프로세스를 4주에서 1주로, 18시간에서 15분으로 단축할 수 있도록 설계되었다. 결국, 계산 소요 시간을 10시간에서 50초로 단축할 수 있다면 수많은 가정형 질문에 대한 해법을 즉각적으로 얻을 수 있을 뿐만 아니라, 하나의 답변을 얻기 위해 오랜 시간을 기다리는 대신 단시간에 많은 모델들을 테스트하여 올바른 해결책을 신속히 찾아낼 수 있다. Goodnight은 “SAS High-Performance Analytics를 사용하면 일주일치 분량 이상의 분석 작업을 단 몇 분 만에 처리할 수 있다”고 강조했다.

5

“SAS High-Performance Analytics는 빅 데이터를 포함한 모든 유형의 데이터 자산을 활용해서 보다 신속하게 최상의 업무 의사결정을 내릴 수 있게 해주므로 궁극적으로 조직은 강력한 경쟁력 우위를 확보할 수 있다.”

Dan Vesset - IDC 비즈니스 분석 리서치 프로그램 총괄 부사장

2011년 10월 26일자 SAS 보도 자료, “단 수분 내에 ‘빅 데이터’를 처리하는 놀라운 솔루션, SAS High-Performance Analytics”

SAS White Paper

Page 7: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

“우리는 비즈니스 문제를 해결하는 조직들의 고정 관념을 바꾸어 놓고자 한다.”

Jim Goodnight - SAS CEO

SAS® High-Performance Analytics를 사용하면 반복적인 분석 라이프사이클을 대폭 단축할 수 있고, 이로써 분석가는 더 많은 이론을 테스트하고, 더 많은 가정형 질문을 제기하고, 더 많은 양질의 결과물을 빠르고 정확하게 산출할 수 있다.

6

SAS® High-Performance Analytics

Page 8: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

어떤 경우에 하이 퍼포먼스 분석이 진가를 발휘하는가?

• 분석할 데이터의 양을 부득이하게 제한해야 하는 상황에 처해 있는가? 그리고, 모든 데이터를 충분히 활용할 수 없는가?

• 단순한 질문으로 만족해야 하는가? 아니면 전혀 질문을 던질 수조차 없는가?

• 부분적으로나마 해결책을 신속하게 도출해낼 수도 없고, 이로 인해 차별화 기회를 놓치는 경우가 발생하는가?

• 분석가들이 모델링 기법의 사용에 제약을 받을 수밖에 없는 상황인가? 예를 들어, IT에서 요구하는 기간의 특성상, 이상적인 로지스틱 회귀 대신 단순한 선형 회귀를 적용해야 하는가?

• 분석가가 복수의 반복 작업을 수행할 시간이 충분치 않으므로 모델을 테스트하고 개선할 여유가 없는가?

위 질문 중 하나라도 해당된다면, 여러분의 조직은 하이 퍼포먼스 분석으로 효과를 볼 수 있다. 사용자는 SAS High-Performance Analytics를 통해 다른 방법으로는 경험할 수 없는 성장 기회를 접할 수 있고, 지속적인 성과 개선과 효과적인 차별화 전략 구사 등의 이점을 얻을 수 있다. 또한 이 솔루션은 의사 결정자들이 고난이도의 질문을 자주 제기하고 시장 진입/퇴출에 관한 결정을 과감하고 신속하게 내릴 수 있게 해준다. 이 같이 유익한 정보로 무장한 조직은 확실한 경쟁력 우위를 점함으로써 보다 능동적으로 시장을 선도해 나갈 수 있다.

조직은 보다 정밀하고 정확한 분석 결과물을 바탕으로 비즈니스 가치를 극대화하고 수익 증대와 비용 절감을 실현할 수 있게 된다. 눈부실 정도로 빠른 속도와 강력한 성능을 자랑하는 SAS High-Performance Analytics는 조직이 후보 시나리오들을 평가하고 급변하는 시장 변화를 적시에 감지해 최선의 권고안을 마련할 수 있도록 해준다. 가령 은행은 소비자 대출 상품 포트폴리오의 신용 위험도를 수시간이 아닌 수분 내에 신속•정확하게 결정하여 대손상각을 줄일 수 있다. 한편, 신용 위험도가 지나치게 높을 경우 연체율과 대손상각 비율이 증가할 수 있다. 어느 금융 기관은 167시간이 소요되던 채무 불이행 가능성에 대한 계산 작업을 84초 만에 끝낼 수 있었는데, 글로벌 은행의 경우 대손상각을 1%만 줄이더라도 절약할 수 있는 액수의 규모의 그야말로 엄청나다.

SAS High-Performance Analytics는 단순히 데이터의 취합이나 서브세트가 아닌 데이터 전체를 충분히 활용해 분석 정확도를 개선해주므로 사용자는 목표 범위를 더욱 구체화해서 가장 효과적인 의사결정을 내릴 수 있다. 사용자는 더 많은 변수와 더 복잡한 모델링 기법을 다룰 수 있을 뿐만 아니라, 반복해서 모델을 검증하고 새로운 아이디어를 테스트할 수 있다. 또, 사용자는 유사한 결과를 산출해내기 위해 통계적으로 의미가 있는 샘플을 찾아내는데 시간을 허비하는 대신 중요한 분석 작업에 더 많은 시간을 할애할 수 있다. 예를 들어, 모든 데이터에 일반 모델을 단순 적용하는 것이 아니라 고객의 고유한 취향과 행동을 통합해서 고려할 수 있는 수천 가지의 부문별 모델을 생성할 수 있는 것이다. 그리고, 이로써 수백만 명의 유력한 잠재 고객들을 대상으로 캠페인에 반응할 가능성이 높은 고객의 상위 예측 인자를 파악해낸다.

7

High-Performance Analytics와 기타 유형의 하이 퍼포먼스 컴퓨팅 솔루션의 차이점은 무엇인가?

그리드 컴퓨팅: SAS로 하여금 그리드 환경에 할당된 중앙 관리 리소스 풀을 자동으로 활용, 작업부하 밸런싱, 고가용성 및 병렬 프로세싱을 실현할 수 있게 해준다.

인-데이터베이스 분석: 인-데이터베이스 컴퓨팅은 연관성 있는 작업들을 데이터에 가까이 이동시켜 데이터베이스 환경 내에서 계산을 실행함으로써 보다 효과적인 데이터 거버넌스와 빠른 분석 결과 도출을 가능하게 한다. SAS Analytics는 데이터베이스 내부에서 실행되므로 시간 소모적인 데이터 이동과 변환 작업을 생략할 수 있는 장점이 있다. 하지만, 데이터베이스 작업부하 관리 시스템이 무엇을 할당하느냐에 따라 분석 프로세싱은 여전히 제약을 받을 수 있다.

인-메모리 분석: 분석 프로세스를 관리하기 쉬운 단편들로 분할한다. 이 경우, 계산은 일련의 전용 블레이드 서버들로 병렬 분산된다.

하이 퍼포먼스 분석: 인-메모리 분석 프로세싱을 활용하는 비교적 새로운 유형의 모델로, 데이터베이스 프로세스의 일환으로 분석을 수행하는 대신 데이터베이스와 동일한 하드웨어에서 별도의 프로세스로 분석을 실행하면서 필요에 따라 신속하게 데이터를 주고받는다. 따라서 인-데이터베이스보다 훨씬 복잡한 분석 작업도 가능하다.

한편, SAS Analytics 프로세싱은 데이터베이스 작업부하 관리 시스템의 제약을 받지 않으므로 모든 시스템 리소스의 활용이 가능하다.

SAS White Paper

Page 9: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

하이 퍼포먼스 분석을 통해 은행이 누릴 수 있는 총체적 가치는, 고객 보유 수와 매출을 늘리고, 은행의 수익 구조를 개선하는 동시에 각각의 개인 소비자 또는 기업 고객에게 최상의 고객 경험을 제공하는 방식 등으로 각 고객에 대해 신상품의 가격을 최적할 수 있다는 점이다.

하이 퍼포먼스 분석은 대규모의 복잡한 네트워크를 거의 실시간으로 분석함으로써 네트워크가 항상 최적의 상태로 유지되고 동적으로 재구성될 수 있게끔 해준다.

케이스 시나리오: 산업 분야별 SAS® High-Performance Analytics의 전망

SAS High-Performance Analytics는 산업 전 분야에 걸쳐 진가를 발휘할 수 있도록 설계된 솔루션이다. 솔루션 도입에 의한 효과와 비전에 관한 내용이 아래에 나와 있으니 참고하기 바란다. 보다 효과적이고 신속한 문제 해결로 여러분의 조직이 얻게 될 성과를 한 번 상상해 보라.

은행 및 재무 관리

고객 관계 동적 가격 책정

오늘날 대부분의 은행은 고객 당 상품 수를 늘리는 동시에 감손을 줄이는 ‘끈끈한’ 관계를 창출하는 교차/상향 판매 기법을 통해 고객 및 중소기업을 대상으로 수익 신장을 꾀하려 한다. 그러나 각 고객에게 상품을 추가로 판매하는 데에는 과제가 따른다. 즉, 현재의 고객 관계 가치와, 다른 신종 상품이 추가될 경우 그 가치가 어떻게 변화할 것인지를 따져서 신 상품의 가격을 수정해야 하는데, 이를 위한 마땅한 방법이 없다는 점이다. 하이 퍼포먼스 분석을 활용하면, 고객이 기존의 은행 상품/서비스를 사용하고 있는 현황과 그에 따른 여러 수익성을 평가하고, 이 정보를 사내에서 보유하고 있는 고객 성향에 관한 정보와 신용 점수 및 외부 데이터(대출 잔고를 비롯한 재무 관계)와 결합해서 고객의 잠재적 평생 가치에 대한 뷰를 획득할 수 있다.

통신

실시간에 가까운 네트워크 수요 변동 처리 능력

네트워크 운영자들은 이제 더 이상 네트워크 수요 변동을 처리하느라 수개월씩 소중한 시간을 허비할 여유가 없다. 더욱이 스마트폰, 태블릿, 온디맨드 HD 동영상, 클라우드 컴퓨팅 등이 소비 패턴의 순간적 변동을 초래하므로 대역폭 소비를 예측해내기가 점점 어려워지고 있다. 전통적 방식의 용량 계획은, 수요 증가에 발맞추어 네트워크 요소들을 업그레이드하는 데 수개월을 소비해도 별 문제가 없던 시대에 개발된 것이다. 하지만 소비자의 기대치가 상승함에 따라 고객 데이터와 실시간에 가까운 네트워크 상태 정보와 상호 관련시키는 새로운 방법론이 요구된다. 대규모 통신 네트워크는 매일 수백만 명의 고객과 관련된 수십억 건의 이벤트를 생성하고 추적한다. 이런 상황에서 하이 퍼포먼스 분석 기술은 네트워크 성능을 거의 순간적으로 분석함으로써 개별 고객에 미치는 영향을 측정할 수 있게 해준다. 그리고 네트워크 운영자는 고객 데이터를 실시간 성능 모니터링과 상호 연계시킴으로써 네트워크의 어떤 부분이 서비스 저하에 영향을 미쳤는지, 또 어떤 고객들이 영향을 받고 어떤 시정 조치가 적합한지 파악할 수 있다. 또한 네트워크 운영자는 고객의 요구에 동적으로 반응함으로써 항시 최적의 역량을 유지할 수 있다.

8

SAS® High-Performance Analytics

Page 10: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

하이 퍼포먼스 분석을 통해 은행이 누릴 수 있는 총체적 가치는, 매출을 늘리고 은행의 수익 구조를 개선하는 동시에 각각의 개인 소비자 또는 기업 고객에게 최상의 고객 서비스를 제공함으로써 고객별로 신상품의 가격을 최적할 수 있다는 점이다.

정부 기관

재무 및 세무 부처

세무 부처들은 종종 정부 관리들의 질문에 답해야 하는 상황에 직면하기도 한다(예: “소득세를 1포인트 인상할 경우 예산에 어떤 영향을 미치는가?”) 많은 조세수입 통계 부서들이 SAS 솔루션을 사용해서 제안된 예산 대안(budget options)의 영향을 모델링•평가하고 조사 결과를 제출한다. SAS는 또한 거시 경제와 세금 징수 간의 연관성을 찾기 위한 시뮬레이션에도 활용되며, 미수금 부채 파악 및 우선순위 설정, 그리고 세무 신고 부정행위 등을 파악함으로써 도시 또는 국가의 재정 구조를 개선하는 데 이용될 수 있다. 방대한 정보— 구조화 및 비구조화 텍스트 데이터를 망라한— 를 보다 신속하게 분석함으로써 세무 부처들은 부정 사례를 조속히 파악하고 세법에 미치는 영향을 즉각 시뮬레이션 할 수 있으며, 거시경제 요인의 변화가 지역 사회에 미치는 영향을 계량화하기 위한 시나리오를 전개할 수 있다. 뿐만 아니라 세법 변경 시, 다양한 모델을 적용해 납세 가능성에 관한 정보까지 수집할 수 있다.

사법 및 공공 안전

법 집행 기관은 지역사회의 인명과 재산을 위협하는 범죄를 감지, 예방, 대응, 해결하는 책임을 질뿐 아니라, 자원, 스킬, 인력의 한계를 시험하는 치안 유지의 보다 포괄적인 과업을 부여 받는다. 하이 퍼포먼스 분석 기술은 법 집행 인력으로 하여금 범죄 빈발 지역을 보다 신속하게 파악하고 주의를 기울여 경찰이 범죄 행위나 활동에 사전 대비하고 신속히 대응할 수 있게 한다. 또한, 구조화 및 비구조화 데이터(소셜 미디어, 텍스트 등)를 망라한 방대한 양의 데이터를 통합해 범죄 활동을 예상하고 방지할 수 있으며, 수사관들은 수동적인 사후 대처 방식에서 사전 대처 방식으로 시스템을 전환해 경찰관과 지역사회의 안전성을 개선할 수 있다.

보건 의료

건강 상태의 예측 및 관리

개인화된 맞춤 의학은 각 환자에 대한 유전 정보를 기초로 최상의 건강 상태를 유지할 수 있도록 도와준다. 물론, 유전 정보는 고도의 데이터 집약적 특성을 지니고 있다(하나의 서열 판독기가 주당 테라바이트 단위의 데이터를 생성). 하지만 하이 퍼포먼스 분석 기술은 특정 환자를 다른 유사한 환자와 단순 비교하는 대신, 그 환자의 개인적인 유전자 구성을 토대로 어떤 치료 옵션이 최선인지 분석할 수 있게 해준다. 하이 퍼포먼스 분석을 통해 대용량 데이터를 초고속으로 분석할 수 있다면, 개인별 맞춤 의학 리서치를 실험실에서 현장 진료소로 옮겨 개인 치료에 효과적으로 적용하는 것도 가능하게 될 전망이다.

9

방대한 정보—구조화 및 비구조화 텍스트 데이터를 망라한—를 보다 신속하게 분석함으로써 세무 부처들은 부정 사례를 조속히 파악할 수 있다.

하이 퍼포먼스 분석을 통해 대용량 데이터를 초고속으로 분석할 수 있다면, 개인별 맞춤 의학 리서치를 실험실에서 현장 진료소로 옮겨 개인 치료에 효과적으로 적용하는 것도 가능하게 될 전망이다.

SAS White Paper

Page 11: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

하이 퍼포먼스 분석을 이용하면 일괄 프로세스로 가격 및 재고 관리를 결정하는 대신, 거의 실시간으로—심지어 예약이 완료된 후에도—이를 최적화하는 것이 가능하다.

이제 보험사들은 날로 증가하는 가용 데이터에 대해 보다 빠른 프로세싱을 지원할 수 있는 하이 퍼포먼스 분석 기법으로 전환하고 있다.

호텔/카지노 산업

거의 실시간으로 이루어지는 수익 최적화

250개의 객실을 보유한 일반 규모의 호텔이 있다. 이 호텔의 경우 약 5 종류의 객실 유형과 8 개의 호텔 투숙 기간 유형에 대해 적어도 향후 365일분에 대한 투숙비 책정과 재고 관리를 계산해야 한다. 이 말은 결국 매일 365만 개의 데이터 포인트를 검토해야 한다는 얘기가 된다. 하지만 하이 퍼포먼스 분석을 이용하면, 일괄 프로세스로 가격 및 재고 관리를 결정하는 대신, 거의 실시간으로—심지어 예약이 완료된 후에도—이를 최적화하는 것이 가능하다. 뿐만 아니라, 각각의 의사결정—일단의 의사결정이 아니라—에 대한 수익 창출을 극대화하고 변화하는 트렌드에 매우 신속히 대처할 수 있다는 이점이 있다.

보험

보험료 산정

보험 상품 가격 책정 및 보험료 산정은 보험사가 리스크를 감수하는 데 대해 부과하는 요율을 정하는 과정이라고 할 수 있다. 보험사, 그리고 특히 보험 회계사들은 과거 데이터를 근거로 향후 행동을 예측하거나 상품 가격 책정을 위한 보험 요율을 산출하는 방법에 크게 의존하고 있다. 종래에 보험 회계사들은 가격 책정과 가격 효율성 모니터링을 위해 일변량 또는 일원 분석에 의존했으나, 지금은 일반화된 선형 모델링 같은 고급 분석 기법을 활용하는 보험사가 점점 늘고 있는 추세다. 원래 보험 회계사들은 과거 데이터를 부분적으로 활용해서 가격 책정 모델을 실행하는 방식에 의존하는 경우가 대부분이었는데, 그 이유는 데이터를 준비하고 모델을 실행하는 데 소요되는 시간이 매우 부담스러웠기 때문이다. 이런 문제를 해결하기 위해 이제 보험사들은 날로 증가하는 가용 데이터에 대해 보다 빠른 프로세싱을 지원할 수 있는 하이 퍼포먼스 분석 기법으로 전환하고 있다.

10

Page 12: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

소매/제조업

완제품 재고 관리

SAS High-Performance Analytics는 소매업체나 제조업체는 물론 여러 장소와 유통 레벨에 걸쳐 대규모의 재고를 취급하는 조직에게 매우 이상적인 솔루션이다. 재고 할당에 관한 의사결정을 내려야 할 때 관건은 바로 “시간”이며, 적시 적소에 올바른 품목을 확보하지 못할 경우 심각한 손실과 고객 만족도 저하라는 대가를 치러야 한다. 대부분의 수요 예측은 과거 납품 데이터를 토대로 이루어지지만, POS(Point-of-Sale) 데이터를 이용하면 대용량 데이터 환경에서도 이력 데이터와 대기 시간 조정 POS 데이터에 대해 인-메모리 프로세싱을 적용하는 것이 가능하다.

석유/가스 생산

SAS High-Performance Analytics는 가동 중인 유정으로부터 들어오는 경고 데이터를 스코어링함으로써 석유 및 가스 생산에 일조한다. 보통 유정 당 최대 8,000개의 센서가 운영되는데, 하나의 플랫폼 또는 유전에 20~40개의 유정이 있다고 할 때 여기에서 생성되는 데이터의 양은 그야말로 엄청난 규모이다. 데이터 경고는 최대 1밀리세컨드의 속도로 유입되어 일정하고 강한 흐름이 유지된다. 이 경우, SAS High-Performance Analytics는 거의 실시간으로 스코어링을 산출하고 최고치를 강조 표시함으로써 작업자가 즉각적인 조치를 취할 수 있도록 한다. 덕분에 회사는 잠재적으로 수억 달러 규모의 손실을 예방하고 재앙 수준의 사태를 미연에 방지할 수 있다.

11

SAS High-Performance Analytics는 거의 실시간으로 스코어링을 산출하고 최고치를 강조 표시함으로써 작업자가 즉각적인 조치를 취할 수 있도록 한다. 덕분에 회사는 잠재적으로 수억 달러 규모의 손실을 예방하고 재앙 수준의 사태를 미연에 방지할 수 있다.

SAS White Paper

Page 13: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

“병렬 처리 방식으로 데이터 전체의 가치를 극대화해 보라. 데이터 용량이 크다는 이유로 엄두조차 낼 수 없었던 일들을 할 수 있게 될 것이다. 우리 SAS는 이 같이 해결이 불가능할 것 같은 문제들을 다루는 데 커다란 보람을 느끼고 있다.”

Jim Goodnight

SAS CEO

결론: 왜 SAS이어야 하는가?

• 비즈니스 분석 및 데이터베이스 어플라이언스 분야의 리더들이 공동으로 구현한 첨단 통합 기술. 비즈니스 분석에 관한 SAS의 전문 기술력과 대규모 병렬 처리 아키텍처에 관한 파트너들(EMC Greenplum과 Teradata)의 깊은 이해가 한데 접목되어 탄생한 첨단 SAS 솔루션. 이 솔루션은 중요 난제를 신속하게 해결할 수 있도록 설계된 통합 소프트웨어/하드웨어 어플라이언스를 제공한다.

• 인-메모리 방식이라고 해서 모두 같은 것은 아니다. SAS는 하이엔드 예측 분석을 지원하고 대용량 데이터를 활용해 신속히 통찰을—분초를 다투는—도출해내는 업계 유일의 인-메모리 분석을 제공한다. 최근 들어 인-메모리 분석이 최대의 관심사로 떠오르고 있지만, 인-메모리 방식이라고 해서 모두 같은 것은 아니다. SAS High-Performance Analytics는 단순히 인-메모리 환경에서 쿼리, 리포팅, 기술 통계 등을 사용하는 데 그치지 않고, 세계적 수준의 고급 분석 기능과 예측, 최적화 기법을 적용, 복잡한 현실 세계 문제를 신속하게 해결한다.

• 모델 개발 및 배치 라이프사이클 전반에 걸쳐 진가를 발휘한다. 여느 경쟁 제품들과 달리, SAS High-Performance Analytics는 기술 통계와 데이터 요약, 모델 구축과 신규 데이터 스코어링에 이르는 분석 작업 전 과정에 걸쳐 놀라운 처리 속도를 자랑한다. 이렇게 신속하게 도출된 분석 결과는 우리 고객들이 더 다양한 모델들을 테스트하고, 더 많은 질문을 제기하고, 데이터에서 더 유용한 가치를 이끌어내어 강력한 경쟁력 우위를 유지할 수 있게 해준다.

• 종래의 방법으로는 불가능했던 대용량 데이터를 발견, 분석, 처리한다. 이 같은 새로운 차원의 기술을 채택함으로써 분석 시장에서 SAS의 리더십은 더욱 공고해질 것이며, 고객들은 대용량 데이터 처리 및 복잡한 시나리오 분석 등을 통해 현실 세계의 여러 난제들을 해결할 수 있게 될 것이다. SAS High-Performance Analytics 솔루션은 모델 구상에서 실전 배치에 이르는 프로세스 전 과정을 획기적으로 단축시켜 줄 뿐만 아니라, 잔광석화와 같은 속도와 강력한 성능으로 고객들이 보다 다양한 시나리오들을 평가하고 급변하는 시장 여건을 신속히 파악•대처하여 강력한 경쟁력 우위를 확보할 수 있게 해준다.

아직도 SAS High-Performance Analytics의 진가에 대해 확신이 서지 않는가? 그렇다면 한결같이 SAS를 비즈니스 분석 분야의 리더로 인정해 온 업계 분석가들에게 조언을 구해 보라. SAS는 이미 오래 전부터 대용량 데이터 환경을 지원해 왔으며 고객들이 직면하는 고도로 복잡한 문제들, 즉 비즈니스 자체를 변혁시킬 만한 특수한 사안들을 해결하는 일을 전문적으로 수행해 왔다. 55,000여 곳 이상의 SAS 고객 사이트를 직접 방문해 보라. 이제 당신은 SAS High-Performance Analytics를 활용해 대용량 데이터 문제와 비즈니스 난제를 해결할 수 있다. 그리고 팩트에 근거한 의사결정의 질과 속도의 획기적인 개선에 놀라게 될 것이다.

12

SAS® High-Performance Analytics

Page 14: 빅데이터 분석을 위한 하이퍼포먼스(고성능) 분석

SAS코리아 : http://www.sas.com/korea

구입 및 일반문의: [email protected]