176
2016 글로벌 빅데이터 융합 사례집 2015 빅데이터 시범사업 및 국내외 사례를 중심으로

글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

2016 글로벌 빅데이터

융합 사례집2015 빅데이터 시범사업 및 국내외 사례를 중심으로

Page 2: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 3: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

2015 빅데이터 활용 스마트 서비스 시범사업

01·현대중공업 컨소시움 ………………………………………………………………………………………… 06

02·대우조선해양 컨소시움 ……………………………………………………………………………………… 32

03·비씨카드 컨소시움 …………………………………………………………………………………………… 46

04·에스지에이 컨소시움 ………………………………………………………………………………………… 66

05·한화 S&C 컨소시움 …………………………………………………………………………………………… 84

빅데이터 활용 사례 - 국내

01·K쇼핑, 빅데이터 분석을 이용한 가구별 특화 상품 노출 시스템 …………………… 96

02·더존비즈온, 빅데이터 기반 회계 관리 시스템 ……………………………………………… 104

03·두산중공업, 발전소 고장예방 및 효율화 사례 ……………………………………………… 112

04·신한카드, 고객맞춤형 타깃마케팅의 성장 …………………………………………………… 120

05·11번가(SK플래닛), 스마트 추천 알고리즘 시스템 구축 ……………………………… 127

06·올레TV(KT), 실시간 시청정보 – 타깃 콘텐츠 제공 …………………………………… 132

빅데이터 활용 사례 - 해외

01·노스페이스, 기계학습을 통한 지식 기반 상품 추천 서비스 ………………………… 138

02·페이팔, 딥러닝을 통한 온라인 사기 방지 시스템 구축 사례 ……………………… 142

03·스타캐스트, 빅데이터기반의 MLB 중계 시스템 …………………………………………… 150

04·Travelbasys, 소셜 및 데이터 기반의 안전 여행 알림 서비스 …………………… 156

05·DB Systel, 센서데이터 분석을 통한 기관차운행관리 개선 사례 ………………… 162

06·오므론, 빅데이터 분석을 이용한 제품 생산성향상 ……………………………………… 168

Contents | 2016 글로벌 빅데이터 융합 사례집

Page 4: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 5: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

01·현대중공업 컨소시움

02·대우조선해양 컨소시움

03·비씨카드 컨소시움

04·에스지에이 컨소시움

05·한화 S&C 컨소시움

2015 빅데이터 활용 스마트 서비스 시범사업

Page 6: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

01

6

사업의 추진 배경 및 목적

1. 사업 추진의 배경

국내 빅데이터 시장은 산업별 빅데이터 활용 사례가 매년 증가하고 있으나, 제조 분야에 활용 사례가 많이

부족하고, 특히 조선 / 해양플랜트 산업은 상대적으로 빅데이터 적용 속도가 늦음

2. 사업 추진 목적

빅데이터 분석 기반 제조 경쟁력 확보를 통한 대·중소 동반성장

제조 프로세스 분석을 위한

빅데이터 클라우드 서비스BIGDATA시 범 사 업

As - Is To - Be

•대규모 프로젝트들이 동시다발적으로 진행

→ 공정 현황 및 지연 원인 파악에 어려움

•엑셀을 이용한 데이터 관리

→ 데이터 및 분석 결과 신뢰도 하락

•이원화 관리에 따른 계허기 일정 정확도 저하

•공정 지연 및 부하 현황 파악 곤란

• 공정 분석 공수 절감 및 공정 관리 업무 효울

20% 향상(3억)

• 공정 지연 단축 및 생산 공수 절감에 의한 생산성

1% 향상(50억)

→ 총 53억원 / 년

Reality Report MXMLXES

이벤트 로그

분석, 모델링

데이터 수집 및 변환 모듈

표준 이벤트 저장소

Page 7: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

7

3. 사업 추진의 필요성

• 글로벌 경제 위기로 인한 소비 심리 약화와 기술 발전 및 비용 부문에서 우위에 있는 신흥국들이 부상함

에 따라 제조업 경쟁력 확보 필요

• 특히 조선 / 해양플랜트 산업의 경우 정확한 시장 예측 부족, 중국발 저가 수주공세, 국제 유가 하락, 특수

선종 경험 부족으로 인한 공정 지연 등으로 위기 도래

- 2015년 3분기 기준 조선 빅3의 누적 영업손실은 대우조선해양 4조 3000억원, 삼성중공업 1조 5300

억원, 현대중공업 1조 2600억이고 매출은 1년만에 16.4% 급감함

• 최근 IT기술의 발달로 ERP, MES, POP 등 시스템을 통한 제조 데이터가 축적되고 있으나 이들 데이터에

대한 분석이 효과적으로 이루어지지 못하고 있음

• 중소기업은 대기업에 비해 전문 인력 및 인프라 부족으로 자체적으로 생산성 향상을 위한 제조 데이터

분석 기술 도입 및 활용에 많은 한계점을 가지고 있음

대·중소 제조기업의 생산현장에서 수집된 데이터 분석을 통한 공정 프로세스 개선방향

제시 및 공정 분석을 위한 교육 프로그램 제공

현대중공업 컨소시움

[그림] 사업개념도

•제조 데이터 분석 표준 가이드라인 제공

•가이드라인에 따른 데이터 수집 지원

•분석 수행 및 결과 리포트 작성

•참여 기업 대상의 포럼 운영

•우수 분석 사례 공유

•지속적인 피드백 수집 및 서비스 개선 활동

분석 컨설팅 서비스 빛 교육 | UNIT

클라우드 기반 공정 분석 플랫폼 | 현대중공업

포럼 운영 | 한국ICT융합네트워크

Page 8: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

추진 내용

1. 주관 및 참여기관

현대중공업, 울산과학기술원, 한국ICT융합네트워크, 사이버다임(위탁)

• 현대중공업 주관기관, 데이터 제공 및 분석 참여, 분석 서비스 활용

• 울산과학기술원 제조 데이터 분석 교육, 중소기업 분석 컨설팅, 분석 시스템 설계

• 한국ICT융합네트워크 포럼 운영, 홈페이지 구축, 테스트용 HANA DB 지원

• 사이버다임 분석 시스템 개발, 클라우드 환경 구축

2. 주요 활용데이터

구분 분류 주요변수 보유기관

생산데이터

생산 계획 및 실적 데이터

블록ID

H중공업

작업ID

계획 착수일

계획 종료일

실적 착수일

실적 종료일

가공 공정 비가동 데이터

공정ID

C사비가동 발생시간

비가동 종료시간

비가동 발생 원인

자동차 부품기업 C사 자동차 부품 생산업체 O사의 자회사이다. 자동차 변속기어 생산업체로 단조 및

가공 생산 전문 기업이다. 본 사업을 위해 공정 비가동 데이터 및 생산 데이터를

제공하였다.

배관 제작 업체 H사 중공업 기자재 전문 업체로 조선기자재, 건설장비 부품, 태양광 모듈 등을 제작

한다. 본 사업을 위해 배관 제작 데이터를 제공하였다.

LED 생산 업체 S사 IT제품군 및 조명제품군 등의 광범위한 분야에 적용되는 LED 제품을 생산하는

종합 LED 기업이다. 본 사업을 위해 샘플 개발 프로세스 데이터를 제공하였다.

DATA 제공업체

8

Page 9: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

구분 분류 주요변수 보유기관

생산데이터

가공 공정 생산 데이터

공정ID

C사

세부라인ID

제품ID

생산 일자

일일 불량품 개수

일일 총 생산량

생산 데이터

케이스ID

H사작업시간

작업자

샘플 개발 프로세스 데이터

케이스ID

S사

작업ID

작업자ID

작업 시작시간

작업 종료시간

3. 분석 내용 및 기법

• 데이터 분석 기법 : 프로세스 마이닝 기반 공정 분석

- 프로세스 모델 도출, 모델 적합도 분석, 병목점 도출, 애니메이션 분석, 프로세스 유형 분석 기능 등이

포함됨

① Dotted Chart를 이용한 프로세스 패턴 분석 : 특정 제조 공정 프로세스를 통과하는 각 제품(Case)별로

패턴을 파악하고 이에 대한 이벤트 수 및 총 소요 시간 등의 통계치를 측정함으로써 프로세스의 특징

을 파악함

② 프로세스 모델 분석 : 프로세스 모델 분석은 트랜잭션 로그를 바탕으로 작업간의 이관관계를 추출하

는 알고리즘을 적용하여 프로세스 모델을 도출

③ 성과 분석 : 작업별, 부서별 빈도수, 수행시간, 대기시간, 소요시간을 포함한 기초 성과 분석과 더불어

2-Dimension 분석, 선후행 분석, 정합률 분석 및 선후행 비교 분석 등의 결과를 다양한 다이어그램을

통해 시각화함

④ 소셜 네트워크 분석 : 작업의 흐름을 나타내는 프로세스 모델뿐 아니라, 제조 프로세스에 참여하는 작

업자, 작업부서 혹은 장비 간의 흐름을 분석하여 이를 소셜 네트워크로 도출함

현대중공업 컨소시움

9

Page 10: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

10

[그림] 데이터 수집 및 정제과정

데이터 수집 및 정제과정

데이터 수집 데이터 전처리 데이터 변환 표준 이벤트

데이터 생성

표준 이벤트 데이터

제조공정데이터 분석

케이스별 분석

작업 분석

위임관계에 따른 분석

위임여부에 따른 케이스 분석

FIRST SELECTED DATE와 SELECTED DATE 관계분석

패턴 분석

데이터 기반프로세스 모델 분석

프로세스 분석

성과 분석

작업별 분석

작업량 분석

작업자 분석

작업별 비교

수행자별 비교

위임관계 소셜 네트워크 분석

프로세스 모델 비교 분석

이벤트 분석

작업 빈도수 및 작업시간 비교

Page 11: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

11

주요 분석 결과 및 활용방안

주요 분석 결과

1. H 중공업 H Project 공정 및 일정 데이터 분석 결과

• 공정 프로세스 모델 도출을 통한 병목점 도출

- 계획 및 실적의 공정 프로세스 모델을 도출함

- 항목별(케이스 / 부서 / 공정) 비교 분석을 수행함

- A부서 재작업 프로세스 발생(19.1일 소요)

- B부서 및 H부서의 계획 일정 조정 가능

[그림] A 중공업 계획 실적 프로세스 모델 비교

• 공정 지연 분석

- 계획 및 실적 데이터 비교 분석을 통해 항목별(케이스 / 부서 / 공정)별 지연값 비교

계획 실적

Page 12: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

12

[그림] 공정 지연 분석

• 공정 부하 분석

- 계획 및 실적 데이터 비교 분석을 통해 부서별 공정 부하 예측

- D부서는 계획 대비 약 2배 증가된 물량을 처리함

[그림] 부서별 부하 비교 분석

계획 데이터

실적 데이터

추출

비교분석

D부서 (Bad) A부서 (Good)

계획평균 21개최대 64개

계획평균 15개최대 41개

실적평균 39개최대 95개

실적평균 18개최대 42개동시종료

- 40 - 66- 20 - 1

07/24시작

08/21시작

09/18마감

09/30마감

09/02시작

10/26시작

10/08마감

10/01마감

Page 13: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

13

2. 미니프로젝트 결과 1 : S사 LED 생산데이터 분석

• Dotted Chart를 이용한 프로세스 패턴 분석

- 약 40%의 케이스가 2주 이내에 완료되며, 60%의 케이스가 3주 이내에 완료됨

- 표준프로세스 상에서 5-6개의 작업으로 프로세스가 종료됨

- 대부분의 프로세스가 7개 이하의 이벤트를 거치는 것을 비추어 반복 작업 또는 반려가 거의 없이 진행

되는 것으로 보임

[그림] Dotted Chart를 이용한 프로세스 패턴 분석

• 데이터 기반 프로세스 모델 분석

- 기존 모델과 달리 작업 ‘B’의 반복 흐름이 발견됨(271번 발생하여 특이 흐름으로 파악함)

- 작업 ‘C’에서 작업 ‘E’까지의 소요시간이 오래 걸림(6.1일)

[그림] 프로세스 모델 분석

[좌 : 케이스별 소요시간, 우 : 케이스별 이벤트 개수]

케이스 40% ↑

케이스 60% ↑

케이스 75% ↑

Page 14: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

14

• 패턴 분석Ⅰ (작업 ‘B’ 반복)

- 패턴 2, 4, 9, 10의 경우, 작업 ‘B’의 1-loop가 발생함

- 같은 수행자가 작업 ‘B’를 수행하지 않음 (일부 샘플의 경우 다수의 요청 승인이 필요한 것으로 판단됨)

- 반복되는 작업 ‘B’의 수행자가 서로 다름 (총 274건 중 273건)

: 특정 샘플의 경우 다수의 ‘B’ 작업이 필요한 것으로 분석됨

- 작업 ‘B’의 수행시간에 비해 작업자간 유휴시간이 상당히 긺(수행시간 중간값:24초, 유휴시간 평균

12.6시간) : 작업자간 유휴시간에 대한 관리가 필요함

[그림] 프로세스 패턴 분석

NO. 패턴 빈도수빈도비율

소요시간(일)

평균 중간 표준편차

1 시작 > A > B > C > D > E > G > 종료 162 33% 11.4 10.4 7.8

2 시작 > A > B > B > C > D > E > G > 종료 98 20% 13.3 10.5 9.9

3 시작 > A > C > D > E > G > 종료 68 14% 15.5 15.4 10.0

4 시작 > A > B > B > B > C > D > E > G > 종료 40 8% 15.1 13.7 7.7

5 시작 > A > B > C > A > B > C > D > E > G > 종료 14 3% 18.7 16.4 12.4

6 시작 > A > B > E > G > 종료 10 2% 3.1 3.2 2.3

7 시작 > A > B > A > B > C > D > E > G > 종료 8 2% 14.2 12.7 6.3

8 시작 > A > C > A > C > D > E > G > 종료 7 1% 23.2 25.8 11.7

9 시작 > A > B > B > C > A > B > B > C > D > E > G > 종료 6 1% 12.6 13.6 5.8

10 시작 > A > B > B > A > B > B > C > D > E > G > 종료 6 1% 17.7 14.0 15.7

•패턴 분석Ⅱ (개별 패턴)

- 패턴 6인 경우,(‘C’ > ‘D’)가 생략되어 있음

: 긴급에 해당하는 패턴으로 작업 ‘B’ 수행 후 바로 작업 ‘E’를 수행한 경우임

: 다른 패턴에 비해 소요시간이 상당히 짧음(평균:3.1일, 전체 평균:10.12일)

•작업별 분석

- 작업 ‘B’와 작업 ‘A’가 전체 발생한 작업 중에 약 40%를 차지함

- 작업 ‘B’ (23.05%)와 작업 ‘F’ (0.42%)를 제외한 5개의 작업은 15% 내외로 균일하게 발생함

Page 15: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

15

[그림] 작업별 빈도수 및 평균 작업시간 & 대기시간

- 작업 ‘G’가 전체 발생한 업무 중에 평균적으로 약 6.5일의 작업시간과 약 4.7일의 대기시간으로 타 업

무에 비해 매우 오래 걸리는 것으로 나타남

[그림] 작업별 작업시간 & 대기시간 구성 비율

- 작업시간과 대기시간 기준 작업별 비중을 살펴보면 작업 ‘G’가 60%, 52%로 가장 높게 나타났으며, 작

업 ‘C’가 21%, 18%로 다음으로 높게 나타남

0 0

100 1

200 2

300 3

400 4

500 5

600 6

700 7

800 8

900 9

빈도수 시간(일)

B A

<작업시간> <대기시간>

C D E G F

빈도 수 평균 작업시간 평균 대기시간

Page 16: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

16

•작업량 분석

- 전체적으로 일별 작업량이 고르게 분포되어 있음

- 대부분 평일 업무 시간대에 많은 작업량이 나타나며, 주말보다 오히려 월요일의 작업량이 거의 없음

- 토요일의 작업량도 평일과 비슷한 양상을 보임

[그림 10] Day-Hour 차트 (요일별 작업량 분포)

- 평일 업무 시간대인 08:00~18:00 사이에 대부분의 작업량이 밀접해 있으며 점심시간에는 또한 작업

량이 거의 없음

- 퇴근 시간 이후 작업량이 지속적으로 감소하다가 00시를 기점으로 작업량이 다수 발생함

[그림] 시간별 작업량 분포

요일

시간(하루)

00

0

50 -

100 -

150 -

200 -

250 -

300 -

350 -

01 02 03 04 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Page 17: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

17

•작업자 분석

- ‘나’ 부서에만 속한 작업자는 42명에 불과하였으며, ‘가’ 부서와 ‘나’ 부서 모두에서 작업하는 작업자는

나머지 131명임 : 모든 ‘가’ 부서 작업자는 ‘가’ 부서 작업과 ‘나’ 부서 작업을 모두 수행함

- ‘나’ 부서는 인원에 비해 위임이 많이 발생함

- 209011은 ‘가’ 부서의 작업 ‘B’, ‘나’ 부서의 작업 ‘C’ 등 사업부서가 다른 두 업무를 모두 수행한 사람으

로 각 부서의 연결고리 역할을 수행함

- 209221은 작업 ‘B’를 전문적으로 수행하여 두 집단의 네트워크 허브 역할을 하는 것으로 보임

[그림] 소셜 네트워크를 이용한 네트워크 허브 파악

•위임 여부에 따른 케이스 분석

- 위임이 발생하는 케이스에서는 작업의 종류가 하나 적게 나타났으며, 작업 ‘F’를 수행하지 않음

- 위임이 발생하는 케이스의 소요시간이 평균적으로 6일 가량 더 오래 걸리는 것으로 나타남

[그림] 위임 여부에 따른 케이스 비교 분석

케이스(위임 ○) 케이스(위임 × )

케이스 수 56 435

이벤트 수 394 3,022

작업 종류 6 7

작업자(수행자, 위임자) 83(64, 18) 165(165, 0)

케이스 별 평균 소요시간 24.6일 18.3일

케이스 별 평균 이벤트 수 7.03개 6.9개

기간 2015-09-22 16:28:12 ~ 2015-12-10 12:53:21 2015-09-22 09:33:01 ~ 2015-12-10 12:54:20

Page 18: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

18

•위임 여부에 따른 프로세스 모델 비교

- 주요 흐름은 전체적으로 비슷하게 나타나나 위임이 있는 프로세스에서는 ‘B’ → ‘D’ 흐름이 발견되지 않음

[그림] 위임 여부에 따른 프로세스 모델 비교 (Frequency)

- 위임이 있는 프로세스는 ‘G’작업의 작업시간과 ‘E’ 작업의 대기시간으로 인해 지연이 발생

[그림] 위임여부에 따른 프로세스 모델 비교 (Performance)

• 위임 여부에 따른 이벤트 분포

- 위임이 있는 케이스는 작업 ‘F’를 전혀 수행하지 않은 것으로 나타남

- 위임이 있는 케이스는 작업 ‘A’가 약 20%로 가장 많이 발생했으며, 위임이 없는 케이스는 작업 ‘B’가

23%로 가장 많이 발생함

- 위임이 없는 케이스에서 작업 ‘F’는 14번으로 가장 적게 발생함

<위임○ 프로세스>

<위임○ 프로세스>

<위임× 프로세스>

<위임× 프로세스>

Page 19: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

19

- 위임이 없는 케이스는 약 75%가 21일 이내에 완료되는 것에 반해, 위임이 있는 케이스는 약 50%만이

완료함

- 가장 오래 걸리는 케이스는 위임이 있는 케이스가 약 64일, 위임이 없는 케이스가 약 67일임

[그림] 위임 존재 여부-Dotted Chart 비교

•위임 여부에 따른 작업 빈도수 및 작업시간 비교

- 모든 작업에서 위임이 있는 케이스가 작업시간이 더 오래 소요되지만, 작업 ‘A’와 ‘B’만 위임이 있는 케

이스가 더 빨리 끝남

[그림] 위임 여부에 따른 작업 빈도수 및 작업시간 비교

위임○

위임×

시간(일)

0 0.00

100

200

100.00

50.00

300

400

150.00500

600200.00

700

800 250.00

빈도수 시간(Hour)

B A C D E G F

위임○ 빈도 수 위임× 빈도 수 위임○ 평균 시간 위임× 평균 시간

Page 20: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

20

3. 미니프로젝트 결과 2 : H사 MRP 데이터 분석

•제작 공정 프로세스 분석

- 제작되는 과정은 아래와 같이 작업의 순서가 정해져 있음

[그림] 제품 제작 공정 프로세스

- 도출된 프로세스 모델과 Dotted Chart를 통하여, Activity E → Activity F와 Activity F → Activity G

에서 작업 이동의 소요 시간이 길다는 것을 알 수 있음

[그림] Dotted Chart와 작업 소요 시간이 긴 구간

•작업별 평균 수행시간

- Activity C와 Activity I의 평균 작업 수행 시간이 짧으며, 반면에 Activity H와 Activity F의 평균 작업

수행 시간은 긺

[그림] 작업별 평균 작업 수행 시간

작업 평균 작업 수행 시간

Activity A -

Activity B 43일 6시간

Activity C 6일 3시간

Activity D 26일 14시간

Activity A

Activity G

Activity B

Activity H

Activity C

Activity I

Activity D Activity E Activity F

Page 21: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

21

작업 평균 작업 수행 시간

Activity E 31일 11시간

Activity F 72일 9시간

Activity G 41일 24시간

Activity H 111일 6시간

Activity I 6일 15시간

•작업자 간 관계 분석

- 작업자 R1이 가장 많은 작업 (75,627건, 38%)을 수행하며, 작업자 간의 작업의 이동 없이 작업이 이루

어짐

[그림] 작업자 간 소셜 네트워크

- 전체 작업자의 평균 작업 소요시간 (중간값)은 2년 64일, 소요시간 (평균값)은 1년 350일로 나타남

- 작업자 R4와 R6의 작업 소요시간은 전체 평균 작업 소요시간보다 짧음

[그림] 작업자별 빈도 수 및 소요시간

작업자 빈도수 소요시간(중간값)

R1 75,627 2년 147일

R2 29,628 2년 125일

R3 24,966 2년 120일

R4 24,561 2년 49일

R5 20,601 2년 77일

R6 12,231 1년 360일

R7 9,999 2년 168일

R8 1,260 218일

R9 144 1년 206일

R10 27 1년 206일

Page 22: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

22

•제품 사이즈별 분석

- 제품 사이즈가 2인 경우, 작업 빈도수가 가장 높음(63,639건, 32%)

- 시간이 많이 소요되는 구간은 공통됨(Activity E → Activity F → Activity G → Activity H)

[그림] 제품 사이즈별 프로세스 모델 (좌 : 빈도수, 우 : 소요시간)

- 전체 평균 작업 소요시간(중간값)은 43.4주, 소요시간(평균값)은 47.2주로 나타남

[그림] 제품 사이즈별 빈도수, 케이스 수, 소요시간

제품사이즈 빈도수 케이스 수 소요시간

(중간값)소요시간(평균값)

제품 사이즈 빈도수 케이스 수 소요시간

(중간값)소요시간(평균값)

2 63,639 7,071 42.4주 46.8주 0.75 2,286 254 52.8주 50.8주

3 26,577 2,953 42.7주 46.4주 18 1,422 158 40.4주 45.2주

1 21,564 2,396 44.4주 48.6주 20 1,224 136 52.8주 51.4주

6 16,272 1,808 45.3주 48.1주 0.2 1,062 118 36.6주 38.8주

8 15,597 1,733 40.6주 43.5주 24 1,017 113 40.9주 42.8주

1.5 13,635 1,515 44.6주 47.1주 2.5 594 66 23.9주 22.7주

4 13,590 1,510 48주 48.4주 30 342 38 46.5주 51주

10 10,134 116 46.1주 50.6주 26 135 15 66.4주 54.8주

14 3,933 437 45.1주 47.9주 36 18 2 56.4주 56.4주

12 3,465 385 45.1주 48.6주 5 9 1 52.8주 52.8주

16 2,529 281 45주 47.2주

Page 23: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

23

4. 미니프로젝트 결과 3 : H사 해양플랜트 배관 제조공정 분석

•Project A와 Project B에 대한 세부 분석

- Project A와 Project B에 대하여 세부적으로 분석을 수행함

- Project A의 경우, Activity F → Activity G (59일 5시간)와 Activity G → Activity H (64일 21시간)에서 지연

이 나타남

- Project B의 경우, Start → Activity A (16일 11시간), Activity F → Activity G (28일 13시간), Activity G →

Activity H (15일 13시간)에서 지연이 발생함

[그림] Project A와 Project B의 프로세스 모델(좌 : Project A, 우 : Project B)

- Project A에서 Activity C, Activity E, Activity I에서 제품 입고 소요시간이 긴 것을 알 수 있으며, Project B

의 경우 Activity I에서의 제품 입고 소요시간이 긺

[그림] ISO 내 제품 입고 Duration (좌 : Project A, 우 : Project B)

66913/59d 5h

16836/28d 13h

5083/16d 11h

4868/10

67222/64d 21h

17701/15d 13h

Activity G

Activity G

Activity F

Activity HActivity H

Start

Activity F

0 0

5010

20

100 30

15040

50

200 60

Sta

rt

∆T(ISO

내 S

pool 입

Sta

rt

Activity

A

Activity

A

Activity

C

Activity

C

Activity

E

Activity

E

Activity

F

Activity

F

Activity

G

Activity

G

Activity

I

Activity

I

Page 24: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

24

- 제품 사이즈별 입고 소요시간을 분석한 결과, 전반적으로 Project A의 소요 시간이 긴 것을 알 수 있었

으며, 입고 작업의 경우 사이즈가 클수록 입고 소요시간이 긴 것을 알 수 있음

[그림] 제품 사이즈별 Project A와 Project B의 입고 및 탑재 작업의 평균 입고 소요시간(평균값)

- 제품 사이즈 별 Activity E에서 Activity G까지의 소요시간을 분석한 결과, 전체적으로 Project A의 소요

시간이 긺

- 세부적으로 보았을 때, Project A의 경우 중 사이즈의 소요 시간이 긴 것을 알 수 있었으며, Project B의

경우 소 사이즈의 소요 시간이 긴 것을 확인할 수 있음

[그림] 사이즈별 ISO내 Activity E → Activity G 소요 시간

대 중 소

MIN 0 0 0

1st PERCENTILE 20 36 28

중간값 94 113 98

3st PERCENTILE 217 253 219

MAX 963 960 943

전체평균 147.7 170.2 153.2

대 중 소

MIN 0 0 0

1st PERCENTILE 13 13 13

중간값 28 28 33

3st PERCENTILE 51.75 51.75 65

MAX 389 389 448

전체평균 38.8 38.8 45.3

0 0

대 대중 중소 소

50 40

20

60

100

10080

150

160

120

200 140

250 180

Project AActivity G

Project BActivity G

Project AActivity E

Project BActivity E

0 200 400 600 800 1000 1200

0 100 200 300 400 500

Page 25: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

25

5. 미니프로젝트 결과 4 : C사 비가동 데이터 분석

•Dotted Chart를 이용한 공정 비가동 발생 패턴 분석

- 각 공정별 생산 패턴과 비가동 발생 패턴을 비교함. 생산 패턴과 비가동 패턴이 대부분 일치하는 것에

비추어, 공정이 가동되는 동안 비가동 문제가 지속적으로 발생한 것을 알 수 있음

[그림] Dotted Chart를 이용한 생산-비가동 패턴 비교

- 이벤트별 시작-종료 패턴을 비교한 결과, 시작과 종료 이벤트가 수직선상에 위치함. 이는 대부분의 비

가동이 발생한 후 당일 내에 재가동됐음을 의미함

[그림] Dotted Chart를 이용한 비가동 시작-종료 패턴 비교

제품을 생산하는 동안(위)대부분 비가동 (아래) 현상 발생

D

B

A

C-L2

C-L1

전반적으로 이벤트의 시작과 종료가 수직선상에 위치하는 것에 비추어, 비가동 발생 후 당일 내에 재가동 되는 것으로 보임

Page 26: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

26

•비가동 발생 프로세스 모델 분석

- 각 공정을 Case로 분류하여 비가동 발생 프로세스 모델을 도출함. CH 작업으로 인한 비가동이 378

건으로 가장 많이 발생했고, 다음으로 RE 및 ETC 순으로 많이 발생함. 비가동 문제가 발생한 이후 다

음 비가동 문제가 발생하는 경우는 CH 작업으로 인한 비가동 발생 이후 같은 문제가 발생하는 경우가

225건으로 가장 많음

[그림 27] 비가동 발생 프로세스 모델 도출

- EX 작업 이후 다음 EX 작업까지의 간격이 가장 짧으며, 비가동 발생 시 평균 소요시간은 EX 작업이

4시간 18분으로 가장 긴 것으로 나타남

[그림 28] 프로세스 모델을 이용한 비가동 발생 간격 분석

- 주간 (08:00 ~ 18:00)과 야간 (18:00 ~ 익일 08:00)의 프로세스를 비교함. 주간에는 CH 작업으로 인

한 비가동이 가장 마지막에 발생한 반면, 야간에는 가장 먼저 발생하는 것으로 나타남

- 주간이 야간에 비해 CH 및 RE 문제가 2배가량 더 많이 발생함

Page 27: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

27

[그림 29] 주간 - 야간 프로세스 모델 비교

•비가동 원인별 빈도수 및 평균 소요시간 분석

- CH 작업으로 인한 비가동이 가장 많이 발생했으며, 비가동 발생 시 평균 소요시간 기준으로 EX 작업이

가장 오래 걸리는 것으로 나타남

[그림 30] 비가동 원인별 발생 빈도 및 평균 소요시간

•비가동 발생 분포 분석

- 9월 초·중순과 10월 말경에 비가동이 많이 발생했으며, 11월은 대체적으로 비가동 발생이 적은 것으

로 나타남

주간(08:00~18:00) 야간(18:00~08:00)

0 0:00

50 0:30

100 1:00

150 1:30

200 2:00

250 2:30

300 3:00

350 4:00

400 4:30

빈도 수 소요시간 중간값평균 소요시간

CH RE ETC EX MM RW CO

Page 28: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

28

[그림] Day-Hour 차트 (월별 비가동 발생 분포)

- 월요일 새벽 및 저녁 시간대에 비가동이 발생하지 않는 것으로 나타났으며, 월요일을 제외한 주중에 주

로 비가동이 많이 발생함

[그림] Day-Hour 차트 (요일별 비가동 발생 분포)

- 야간에 비해 상대적으로 주간에 비가동이 많이 발생했으며, 하루 중 오전 8시에서 9시 사이에 비가동

이 가장 많이 발생하는 것으로 나타남

일자

시간(하루)

요일

Page 29: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

29

[그림] 시간대별 비가동 발생 분포

•소셜 네트워크 분석

- C 공정의 2번 라인에서는 RW 문제가 발생하지 않음

- D 공정은 EX 없이 제품을 생산한 것으로 나타남

- CO로 인한 비가동은 B 공정과 C 공정에서 발생함

[그림] 소셜 네트워크를 이용한 공정별 비가동 발생 현황 분석

A

B

D

C-L1

ETC

EX

RE

CH

RW

MM

CO

C-L2

Page 30: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

30

6. 서비스 계획 및 활용방안

•클라우드 컴퓨팅 기반 실시간 분석 플랫폼 구축 및 제공

- 실시간 분석, 분석결과 시각화 등 이용 기관의 데이터 분석을 위한 클라우드 컴퓨팅 기반 플랫폼 구축

공정 빅데이터의 효율적 관리 및 이용을 위해 클라우드 기반 프로세스 분석 플랫폼을 제공

- 공정 데이터의 오류를 최소화하고 체계적인 관리를 위해 클라우드 서비스를 이용하여 실시간으로 데

이터를 저장, 처리 및 전송함으로써 공정 데이터 현황 파악, 품질점검, 설비 현황 및 표준화 등 추진

기대효과 및 사업 활용 방안

1. 기대효과

•제조 공정의 실시간 예측을 통한 생산효율 고도화

- 제조 장비 및 공정에 소요되는 부품별 상태 정보, 중장비 시설이나 첨단 제품 설비 운영에 있어 발생하

는 데이터 등을 수집, 분석하여 고장 및 장애 예측이 가능

- 불량률 감소, 개발기간 단축, 생산관리 최적화 및 운영비용 절감 등 기업의 생산성과 경쟁력 향상

•데이터 제공을 통한 연계 사업 지원

- 제조 공정 빅데이터 분석 결과 및 빅데이터 분석용 요소 데이터들을 필요로 하는 외부 기업이나 기관

에 제공하여 2차 사업 활성화 및 빅데이터 서비스 사업에 기여

2. 향후 활용방안

•분석 서비스 및 교육 제공

- 공정 데이터 분석 (프로세스 마이닝) 기본 이론 교육과 툴을 사용한 공정 데이터 분석 교육 및 실습 제공

- 맞춤형 데이터 분석 컨설팅 및 리포트 제공

- 개인 모바일 기기를 통한 데이터 분석 리포트 제공

Page 31: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

현대중공업 컨소시움

31

• 대상 지역 확대

- 현재는 현대중공업 및 유수의 제조 기업들이 참여하는 서비스로 추후에는 대상지역을 확대하여 보다

많은 제조 기업들의 활용을 위해 서비스를 제공

•분야별 맞춤형 분석 템플릿 제공

- 도메인별로 특화된 분석 패키지 및 베스트 프랙티스를 만들어서 각 분야에 특화된 맞춤형 분석 템플릿

을 제공하여 보다 쉽게, 의미 있는 분석을 할 수 있도록 기능 제공

- 특히 기존 시스템의 약점을 보완하여 생산 프로세스 분석에 활용이 가능하도록 병목점 분석 등의 제조

업에 특화된 처리량 분석 등을 제공하고자 함

Lessons Learned

제조업에서는 실제 공정 수집부터 용이하지 않아 연구원이 현장에 투입되어 데이터 수집부터 시행

하였음. 산업 현장에서 해양플랜트 같은 특수구조물의 제조공정은 그 특수성으로 인해 쉽게 개선될

수 없다고 여겨지고 있었으나, 프로세스 마이닝을 통해 작업 공정의 문제점을 체계적으로 파악하여

선제적인 조치가 가능함을 확인. 본 과제 수행을 통해 해양플랜트를 비롯한 제조업에 빅데이터를 적

용하여 경쟁력을 향상할 수 있음을 확인

Page 32: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

32

사업의 추진 배경 및 목적

1. 사업 추진의 배경

• 조선업 경쟁 환경의 변화

- 중국의 추격과 엔저 기반 일본 조선업의 회생

- 국내 대·중소 조선업체의 실적 악화

• 선박제품 신수요 창출의 어려움

- 전통적인 수주 산업으로 평균 2~3년의 설계·생산 기간이 걸려 신규제품 수요 창출에 소극적

- Market의 game changer가 될 만한 제품 개발 사례가 적음

• 국내 조선해양기자재 산업의 침체

- 조선업의 위기는 곧 중소 조선기자재 산업의 위기임

2. 사업 추진 목적

• 빅데이터 기반 신수요 창출 및 MRO(Maintenance, Repair & Operation) 서비스 사업 모델 제시를 통한 조

선연관산업 전체의 지속 가능한 성장 모델 구축

① 선박 신수요 예측 플랫폼 개발

- 선박 신제품 및 신기술 개발에 활용될 수 있는 중기(3~5년) 조선 시황 예측 모델 개발

- 미래 기술 트랜드 및 고객에 대한 분석을 통해 시장에서 필요로 하는 제품 및 기술 경쟁력을 확보하여

시장 우위 유지

02 선박 신수요 예측플랫폼 및

MRO 서비스 모델 개발BIGDATA시 범 사 업

Page 33: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

33

[그림] 선박신수요 예측 플랫폼 개발 (As-is vs To-be)

② 선박MRO서비스모델 개발

- 기존 해운사 주도의 네트워크에 의한 비즈니스 방식으로 인해 공급업체의 비즈니스 기회 및 경쟁력이

약했음

- SmartMRO 플랫폼에 의한 비즈니스 기회 증가 및 시장 확대에 따른 중소형 공급업체 지속 성장 및 해

외 시장 진출 가능

조선 해운 선박 관련 빅데이터 분석을 통한 선박 신수요예측으로 선박제품 및 기술 수요

에 선제적으로 대응하고 MRO(선박 기자재 / 부품 공급 유지 보수) 서비스 사업모델 개발

대우조선해양 컨소시움

•선사관점의 시장 추정

• 단기수요(6개월), 장기전망(5년

이상) 시장추정이 이루어짐

• 이전통적인 해운시장지표만을

활용해옴(선사별 분석 불가)

•조선족 관점의 시장 전망

• 중기(3년) 선박 시황 예측

- 예측 난이도가 매우 높음

• 수요예측 결과를 제품 및

기술개발과 연계

• 중기 수요 예측 및 당사 경쟁력 분석

• 제품별 경쟁력 강화 방안 수립 & 당사

제품 / 기술 로드맵 적용

조선소 관점의

시장분석 어려움

(제품 및 기술개발

mis-match)

시장(고객)에게

필요한 제품 및

기술을 최적기에

개발하여 제품수주

극대화

As - Is To - Be

Page 34: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

34

[그림] 선박MRO 서비스 모델 개발 (As-is vs To-be)

3. 사업 추진의 필요성

• 조선산업 : 전통적인 주문생산 방식에서 선제적인 제품·기술 개발을 통한 마케팅 필요

• 조선기자재 산업 : 현재 선박 신조 물량에만 집중되어 있어 조선시황에 따라 영향이 큼. 지속적인 사업모

델 MRO 서비스 사업 진출 필요

• 빅데이터와 제조업의 시너지 효과를 통해 새로운 성장 동력 발굴 필요

• 고객(해운사) 주도의 비즈니스 구조

- 기존 거래 Network 활용

• 중소 공급업체의 경쟁력 약화

• 시장확대의 어려움

MRO 공급업체

• 최적의 MRO 패키지 제공(비용, 납기)으로 인한 고

객 유치

• 중소 공급업체 비즈니스 기회 증가

• 잠재고객 마케팅에 의한 시장 확대 가능 - 해외 선사

의 국내 MRO 업체 공급 기회 증가

As - Is To - Be

Page 35: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

35

대우조선해양 컨소시움

추진 내용

1. 주관 및 참여기관

대우조선해양, 더존비즈온, 융합산업연합회

• 대우조선해양 주관기관, 빅데이터 분석모델 및 비즈니스 모델 설계

• 더존비즈온 IT 기술개발 총괄, 빅데이터 플랫폼 개발

• 융합산업연합회 비즈니스 모델 사업화 지원

2. 주요 활용데이터

구분 분류 주요변수 설명 보유기관

경제지표

세계 경제지표

GDP

OECD IP

LEI

China PMI약 350여종 경제 및 조

선해양 지표 1999년 1

월 ~ 2015년 7월까지

약 15년 이상의 월간 데

이터

OECD

World-Bank

IMF

Clarksons

Market-Economics

EIA

원자재

철강 생산량

철광석/석탄/곡물

유가

금융금리

환율

대우조선해양(주)

(주)더존비즈온 융합산업연합회

총괄기관

과제참여기관

• 과제총괄

• Biz. 모델 설계

• 분석목표 설정

• 분석모델 설계

• Data 획득

• IT 기술개발 총괄

• IT Platform 설계

• IT Platform 제공

• IT 요소기술 연구

• 선박MRO 사업화 모델 계발

•선박MRO supply chain 구축 지원

• 선박MRO 사업화 지원

Page 36: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

36

구분 분류 주요변수 설명 보유기관

조선산업

지표

물동량

해상 물동량

해운 운임

선박 용선료 약 350여종 경제 및 조

선해양 지표 1999년 1

월 ~ 2015년 7월까지

약 15년 이상의 월간 데

이터

Clarksons선단

선박 리스트

선사

선령

선박 건조Orderbook

선박 건조량

위성정보 선박 위성정보 AIS 데이터실시간 선박위성 데이터

6개월분 하루 1.5GBORBCOMM

내부

데이터고객(선주)정보

고객리스트

고객별 선호 데이터

Claim 데이터

당사 건조 약 800척 이

상에 대한 고객 및 선박

데이터

DSME

기술문건 조선해양 매거진

Ship & Offshore

Motor Ship

Bunker World

약 5년치 월간 / 격주

매거진매거진 발행기관

선박

주요정보선박기본정보

DWT

Dimension

IMO

항로

선급

선박에 고유정보

선박의 위치 / 항로 등

운항 정보

Clarksons

Marine-Traffic

ORBCOMM

선박

기자재

선박 내

기자재 정보

Spec.

Model

선박 내 주요 기자재

정보

Clarksons

선급

기자재 / 부품 정보

업체명

사양

모델

공급 가능한 기자재 /

부품 정보기자재협동조합

선박 검사

/ 수리

정기 검사 /

수리 / 교체 규정

검사일정

검사항목

선박 및 선박 내 기자재의

검사 / 수리 / 교체 규정선급

3. 분석 내용 및 기법

• 데이터 분석 기법

① 선박 신수요예측 플랫폼개발

- 선박 신조 수요 예측 및 Segment별 선박 발주량 예측을 위해 다음의 절차로 데이터를 분석 함

- AR(Autoregressive) 모델을 이용하여 2018년 선박 발주량 예측

Page 37: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

37

대우조선해양 컨소시움

- 선박 크기별로 segment를 분류하고 최근 발주 패턴을 분석하여 segment 별 특징을 분석 함

- 사내·외 전문가 인터뷰를 통해 미래 선박 발주 패턴 예측

- 향후 선박 수요량을 발주되는 선박의 주요 사이즈로 나누어 segment 별로 발주 수량(척수) 예측

② 선박MRO서비스모델 개발

- 최적 MRO 패키지분석 : 기자재 등록 데이터를 바탕으로 견적요청에 대한 최적 견적 도출

- 잠재고객 추정 : AIS 데이터와 선급데이터를 바탕으로 부산항 경유 이력 선박 추출, 도착예정일 기

반 위치 범위 설정, 현시점 위치 범위 내 선박 추출, 잠재고객 판단을 통해 잠재고객 추정

- 선박 실 운항 데이터 분석 : 과거 태그 데이터를 활용하여 인공지능 알고리즘을 통해 시그널을 학습

시킴, 실시간 데이터 값을 학습 모델이 예측한 값과 비교 분석하여 이상상태가 발생할 경우 경보로

알림

- 선박 기자재 상태진단 시뮬레이터 분석 : 비정상적인 구간에서의 예지 보전을 위해 장기간의 장비

운항에 대한 학습을 통해 extrapolation function을 이용한 operating range 경계 조건을 구축, 지속적

인 감지 및 학습을 통해 민감도 높은 비정상 구간에 대한 위험 제어 수행, 다양한 고장 현상 및 모드

에 대한 정학한 이해 및 판단을 위해 frequency domain 에서의 FFT(Fast Fourier Transform) 분석을

동시 수행

•데이터 분석

① 선박 신수요예측 플랫폼개발

- 데이터 수집 전 세계 주요 경제 지표, 조선·해양 관련 지표, AIS 데이터(선박 위성 정보), 당사 내

부 고객 관련 데이터, 비정형 데이터 등을 구매 및 수집하여 분석 시스템으로 전송

- 데이터 저장 모든 데이터를 빅데이터 분석 플랫폼 “로그프레소”에 저장

- 데이터 분석 1) 변수간 상관분석 및 회귀분석 수행

2) AR모델 및 인공신경망 모델 예측

3) 고객 선박 발주 패턴 분석

4) AIS 데이터 시계열 분석

- 분석결과 활용 1) 분석을 통하여 미래 선박 발주 수요를 예측하였으며, 당사에 발주 가능성이 높

은 고객 및 제품에 대한 분석을 완료함

2) 본 결과는 2016년 제품 및 기술 로드맵 구축에 활용

3) AIS 데이터 분석 결과를 토대로 선주들을 대상으로 영업 활동을 진행하기 위해

준비 작업에 착수

Page 38: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

38

② 선박MRO서비스모델 개발

- 데이터 수집 총 40여개 기관을 접촉하여 신수요예측 필요 데이터 및 선박MRO에 필요한 선박

주요정보, 선박기자재정보, 기자재 / 부품 업체 정보, 선박 운항 정보 등을 수집

- 데이터 저장 선박MRO 플랫폼과 연동이 되는 웹 DB와 빅데이터 DB를 구축하여 분석 가능 데이

터 형태로 DB에 저장

- 데이터 분석 최적화 기법, 인공지능 알고리즘을 통한 기계학습 기법, 진동데이터 분석 기법이

적용

- 분석결과 활용 1) 분석결과를 바탕으로 구축된 선박MRO 플랫폼은 구매지원, 예방정비지원, 마케

팅 서비스를 제공하는 스마트 플랫폼을 구현

2) 실제 적용 기관과의 협약을 완료하였으며 플랫폼 상용화 예정

[그림] 신수요예측 및 MRO 서비스 개념도

선박 신수요 예측플랫폼 개발 선박 MRO서비스 개발

BigData

분석

플랫폼

분석

결과

실증

방안

● 다양한 종류의 데이터[정형/비정형]

• 경제지표, 물동량, 조선연관데이터,

선주데이터 등

⇨ 원유운반선의 경우 : 70여종 데이터

● 대용량 데이터

• 전세계 선박운항데이터(1천만건/Day)

1. 시장예측결과를 DSME 영업전략 수립에

활용

2. 제품포트폴리오 예측결과 활용 DSME 제

품 및 기술 개발계획 수립 및 실행

빅데이터 분석엔진 “LOGPRESSO”, 데이터분석 도구 “R” 연동한 높은 자유도의 분석 플랫폼 구축 [기구축]

플랫폼 개발범위 [더존]

● 다양한 종류의 데이터[정형/비정형]

• 기자재/부품데이터, 기자재업체데이터

항만데이터, 선급데이터 등

⇨ 원유운반선의 경우 : 70여종 데이터

● 대용량 데이터

• 전세계 선박운항데이터(1천만건/Day)

• 선박탑재 기자재 운전 데이터

1. 중소형 해운사 - 기자재 업체간 본 서비

스 활용

2. 당사 기자재사업의 MRO 서비스에 활용

다양한 종류형태 정보저장

(Parsing)통계분석

Mining

가시화

조선사관점

선박수요량

예측결과*

최적 MRO 패키지 분석

장비/부품 최소비용 및 납기 공급

최적 수리/엔지니어링서비스 sourcing

이력 관리 및 예지보전

기자재 상태분석

기자재 신호분석(기계학습)

수리/보수 Alert

3~5년 DSME

제품

포트폴리오

예측결과

제품별

차별화 분석

(고객, 신기술)

Page 39: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

39

대우조선해양 컨소시움

주요 분석 결과 및 활용방안

주요 분석 결과

1. 선박 신수요예측 플랫폼개발

• 선박 신수요예측

- 세계 경제지표 및 조선 / 해운 산업 관련 데이터 분석을 통해 미래 선박 수요예측 가능

- 컨테이너선의 경우 3년 후 대형선박이 주류가 될 것이라는 예측 결과 도출

• 선박 가동률 분석

- 주요 해운사(고객)의 운항 항로 별 선박 가동률 지표 개발

- 선박가동률 분석을 통한 각 선사의 운항 수익 및 잠재 신조 수요 예측 가능

[그림] 컨테이너선 발주량 예측 결과

• 세계 경제 지표 및 조선, 해운 산업 관련 데이터 분석을 통해 미래 선박 신수요 예측이 가능한 모델 개발

• 선종별 신수요 예측 가능한 분석 모델 및 엔진 구축

2018년 Containership 수요예측

선박의 사이즈 별 발주량 (척수, 단위 : 척)선박의 사이즈 별 발주량 (Volume, 단위 : TEU)

대형

초대형(16,000TEU이상이 대부분)

소형3,000~7,999TEU

중형8,000~11,999TEU

대형12,000TEU 이상 중형 소형

Page 40: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

40

[그림] 컨테이너선 발주량 예측 결과

• 유망기술 도출 (Text Mining)

- 선종별 주요 이슈를 seed keyword로 기술문건 등 비정형 데이터 분석

- 분야별 keyword 추출, 연관관계 분석 등을 통한 기술 트렌트 분석

아래 그래프는 선박전문기술잡지에서 추출된 컨테이너선의 사이즈에 대한 기간별 출현 빈도를 나타냄

컨테이너선의 기술 트랜드가 점점 대형화되고 있음을 확인할 수 있음

[그림] 텍스트 마이닝 분석결과

• 주요 해운사(고객)의 운항 항로별 선박 가동률* 지표 개발

• 선박 기동률 지표를 분석하여 선사의 운항 수익 및 신조 수요에 대한 잠재성을 예측할 수 있음

해운 3사의 주요 항로별 선박 가동률

※ 선박 기동률(Utilization) : 운항중인 선박의 화물 적재량을 선박 loading rate으로 지표화하였음

Page 41: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

41

대우조선해양 컨소시움

• 선박 발주 예상고객 분석

- 전 세계 선사의 선단 규모, 선박 발주 현황, 지역 등의 데이터 군집 분석

- 제품 사이즈 별 발주 예상 고객 도출

[그림] 컨테이너선 사이즈별 발주 예상고객 분석결과

• 유망기술 도출 (Text Mining)

- 선종별 주요 이슈를 seed keyword로 기술문건 등 비정형 데이터 분석

- 분야별 keyword 추출, 연관관계 분석 등을 통한 기술 트렌트 분석

[그림] 유망기술 도출 분석결과

• 전세계 선사에 대해 보유 선단

규모, 선박 발주 현황, 지역 등

의 데이터를 바탕으로 군집

분석

• 제품 사이즈 별 발주 예상 고객

도출

소 형

발주가능성 높음 발주가능성 없음

중 형

대 형

컨테이너선 사이즈별 발주 예상 고객 Mapping

Word Cloud Cluster Dendrogram• 선종별 주요 이슈를 seed

keyword로 기술문건(매거진,

저녈 등)에 대한 비정형 데이

터 분석을 수행

• 분야별 keyword를 추출, 연관

관계 분석, 기술 트랜드를 파

악하여 당사 제품 / 기술 로드

맵 개발에 활용함

• [예제] 매거진 “LNG World”에서 지난 1년간 가장 많이

나온 Keyword들

⇨ 최신 기술 트랜드 및 이슈 파악

• 소형은 대부분 Regional shipping을 전문으로 하는 local 업체들이 담당

• [예제] 매거진에서 가장 많이 노출된 Keyword들간의

상관관계 분석

Page 42: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

42

2. 선박MRO서비스모델 개발

• 최적 MRO패키지 분석

- 고객의 다양한 MRO서비스 및 제품 구매 요청에 공급가능업체 자동 검색 및 견적대행을 통한 최적 패

키지 도출

[그림] 최적 MRO 패키지 분석결과

• 잠재고객추정 분석 결과

- AS 데이터 분석을 통한 부산항 도착 예정 선박 추정

- 선박 기자재 정보와 연계하여 적기에 MRO 서비스 공급 가능

[그림] 최적 MRO 패키지 분석결과

고객 플랫폼/관리자 공급업체

견적 요청접수

견적서 등록

공급 가능업체 분석

견적 요청

견적 요청가능

최적 견적도출

견적 등록알림

제품/서비스확정

이력 등록

제품(다수)입력

견적서 조회

견적 선택서비스 신청

서비스 완료신청

Process

Process

제품/서비스공급

고객 플랫폼/관리자 공급업체

Port명/도착예정일 입력

잠재고객 판단

도착예정일 기반위치 범위 설정

현시점 위치 범위내 선박 추출

대상 선박 검색

홍보메일 발송

Port 경유 이력선박 추출

플랫폼 접속

Page 43: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

43

대우조선해양 컨소시움

• 기자재 상태진단분석 결과

- 선박 내 주요 기자재의 실 운항 데이터 분석을 통한 기자재 상태진단 및 조기경보시스템 구축

- 아래 그림 분석 결과 : 상단 그래프는 Main C.S.W Pump Outlet Pressure 데이터의 실측값(빨간색)과 예

측값(초록색), 잔차(파란색)를 나타내며 하단 그래프는 Economizer Steam Pressure 데이터를 나타낸다.

먼저 첫 번째 그래프의 좌측 파란 박스 실측값은 2~4까지 높게 올라가 이상 현상 알림이 발생하였음.

동시에 하단 그래프에서도 예측값보다 실측값이 낮게 나타나 이상 현상 알림이 발생하였음. 이를 통해

두 장비의 이상징후가 연관되어 있음을 추정할 수 있음.

[그림] 자재 상태진단 분석 결과

3. 서비스 계획 및 활용방안

• 선박 신수요예측 플랫폼개발

- 미래 선박 신조 수요 예측, 고객 및 경쟁 분석, 유망기술 도출의 결과를 대우조선해양 제품개발 및 영업

전략 수립을 지원하는데 활용하고, 제품 및 기술 로드맵 구축에 이용

- 지속적인 데이터 업데이트 및 분석 모델 고도화 진행 예정

Page 44: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

44

[그림] 선박 신수요예측 활용방안

• 선박MRO서비스모델 개발

- 빅데이터 기반 선박MRO 플랫폼을 기자재 업체의 중립적인 단체인 한국조선해양기자재공업협동조합

을 통해 운영하여 실 비즈니스에 적용할 예정

- 동시에 대우조선해양이 건조한 선박의 기자재 A/S에 본 플랫폼을 적용하여 플랫폼이 조기 정착하는데

기여할 예정

[그림] 선박 MRO 사업 모델(안)

• 선박 수요 모니터링

• 대우조선해양 제품 포트폴리오 개발

• 영업 및 마케팅에 활용

• 적극적인 수요창출 기대

• 유명 제품 및 기술 발굴

• 제품 로드맵 개발

• 기술개발 로드맵 개발

• 빅데이터 시범사업 결과 활용

• 공동연구개발

고객선사 기자재업체

선용품업체

수리조선소

선급

SmartMRO플랫폼

Page 45: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

45

대우조선해양 컨소시움

기대효과 및 사업 활용 방안

1. 기대효과

• 선박 신수요예측 플랫폼개발

- 중기 수요 예측 및 당사 경쟁력 분석을 통한 조선소 관점의 시장 전망

- 시장(고객)에 필요한 제품 및 기술을 최적기에 개발하여 제품 수주 극대화

• 선박MRO서비스모델 개발

- 최적의 MRO패키지 제공을 통한 고객사의 비용 및 납기 절감

- 빅데이터 분석 기반의 선박MRO플랫폼을 통한 국내 선박MRO 서비스 산업 활성화 및 매출 성장

2. 향후 활용방안

• 선박 신수요예측 플랫폼개발

- 대우조선해양 내부 제품 및 기술 개발 전략 수립에 활용, 대우조선해양의 적극적인 수요 창출 활동에

기여 가능함

- 조선해양 분야 수요 분석 서비스 기관들과의 시장 분석 협업을 계획 중이며, 이는 조선산업 전체를 위

한 공동 서비스 추진 뿐만 아니라 협업 기관들의 시장 분석 역량을 증대 시킬 수 있는 Win-Win 효과를

가져올 수 있음

• 선박MRO서비스모델 개발

- 한국조선해양기자재공업협동조합과 SmartMRO 플랫폼 확대개발 및 운영 통한 후속 사업화 (공동연구

개발 및 향후 사업화 협력을 위한 MOU 체결)

- 기자재 상태 진단 기술인 CBM(Condition Based Maintenance) 기술 적용을 위해 실 운항 데이터와 시뮬

레이터 데이터를 분석하여 특성을 파악하였으며 데이터의 안정적인 연동과 플랫폼 기능의 확장을 통

해 선박MRO 플랫폼에 접목하여 사업 활성화에 기여할 계획임

Lessons Learned

빅데이터 분석을 위해 데이터를 확보하는 것이 가장 큰 난관이었음. 우여곡절 끝에 기존 해운사에서

는 알 수 없었던 정보를 제공할 수 있다는 점을 설득하여 국내 유수의 해운사의 데이터를 확보할 수

있었음. 세계 유수의 조선 연구기관을 벤치마킹하여 분석모델을 구성하였음. 본 과제는 내부 연구원

들이 직접 분석을 수행하였으며 이를 위해 R 등 통계교육을 진행하여 10여명의 데이터 과학자를 육

성한 것은 본 과제의 또 다른 성과임

Page 46: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

46

사업의 추진 배경 및 목적

1. 사업 추진의 배경

• 카드사 내부의 신용카드 거래 데이터 분석을 통한 고객 마케팅의 한계 발생

- 카드사 경쟁심화로 각 카드사의 시장 점유율 하락과 다양한 카드상품 출시로 인해 한 카드사의 거래

데이터로 고객의 특성을 설명하는데 한계가 있음

- 빅데이터 시대를 맞아 소셜 데이터(Social Media Data)를 활용한 마케팅 시행의 필요성 대두

- 카드거래 데이터(정형 데이터)와 소셜 데이터(비정형 데이터)를 연계한 마케팅 성공 사례 창출 필요

03 선박 신수요 예측플랫폼 및

MRO 서비스 모델 개발BIGDATA시 범 사 업

융합 빅데이터 기반

소비 트랜드 플랫폼 구축

[과제 목표]

새로운 마케팅을 하라는데,

어떤 키워드를 잡아야 할지 모르겠어요...

새벽1시까지 자료를 보고 찾아도,

제가 본 게 다가 아닐 수 있다는 생각이

자꾸 들어요...

어떨 때는 마케팅 반응이 확 뛰는데,

어떨 때는 반응이 없어 편차가 너무 커요

...

변화무쌍한 Trend 주기에 맞춰 시의적절한 마케팅

내부 카드데이터 기반 고객 세분화 한계

금융분야 카드 마케팅에 실제 적용하여 유용성 검증

외부 비정형 데이터를 내부 정형데이터와 연계할 수

있는 방법론 개발

•카드데이터는 사회 현상에 대한 후행 지표

•소비자 1인1색의 시대를 지나 다중소비성향을 보임

•사회적 이슈에 의해 소비의 변동성 증가

기존 고객 Segmentation의 한계 기존 마케팅 담당자의 어려움

Page 47: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

47

2. 사업 추진의 필요성

- 대한민국 사회의 소비 트랜드 변화를 분석 및 예측하여 BC카드 본원 사업의 경쟁력 강화에 기여하고

기회가 된다면 이를 바탕으로 신규 사업 기회 발굴

- 금융 산업 및 타 산업까지 빅데이터 활용한 마케팅 전파 및 확산

소셜 빅데이터(Social Media Data)와 카드 결제정보의 융합(mesh-up)하여 소비 트랜드를

추출하고 트랜드 프로파일링 작업을 통해 신용카드 분야의 타겟 마케팅 성공 사례 도출

비씨카드 컨소시움

1. BC카드 마케팅 활용

3. 공공/민간분야 활용 지원

2. 금융산업(회원사, 고객사)

빅데이터 확산

목적

소비활성화

소비 트랜드 도출 및

트랜드 그룹 소비유형 파악

트랜드 프로파일 기반

마케팅 플랫폼 제공

카드 정보 연계를 통한

트랜드 검증/정교화

추진배경

산업발전기여

• 모바일 결제의 가속화, IT기업의

Fintech 진출 등 IT와 금융사 간의 영

역 다툼 심화

• 수익성 위주의 시장경쟁 심화로 새

로운 수익 모델에 대한 관심

→ 내수 경기 활성화 기여

• 소셜 데이터 및 신용카드 거래 데이터 분석으로 마케팅 활성화

→ 신규 상품 및 서비스 구축→ 마케팅 오퍼 리스트 구축→ 채널별 마케팅 방향 도출

• 빅데이터를 통한 공공사업으로 산업 전반의 발전에 기여

→ 자영업자, 소상공인 등 빅데이터 기반 마케팅 및 의사결정 지원

• 금융 상품의 부가 서비스 등 활용에

대한 관심 증대와 다양한 채널을 통

한 의사 표현

• 고객과의 상호 소통을 증시하는 마

케팅 전략이 보편화

• 사회현상, 이슈 등 변화하는 특성을

반영한 마케팅 활동 필요성 대두

• 고객의 숨어있는 니즈를 반영한 소

비 트랜드 분석 frame 마련

• 트랜드 분석을 통한 산업 전반의 새

로운 사업 기회 발굴

금융 환경의 변화 고객/시장환경의 변화 내부 환경의 변화

Social media+ Credit card Data

“소비 트랜드 분석 플랫폼 구축을 통한 마케팅 역량 강화”

추진목적 기대효과

Page 48: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

48

추진 내용

1. 주관 및 참여기관

BC카드, LG CNS, 소상공인시장진흥공단

• BC카드 주관기관, 전체 서비스 총괄 기획 및 개발 지원, 서비스 운영 및 홍보, 카드거래데

이터 분석 및 트랜드 도출

• LG CNS 소비트랜드 분석 프레임워크 구축, 소셜 분석 방법론 기반 소비 예측 알고리즘 개발

• 소상공인시장진흥공단 소상공인 교육, 소상공인 활용 서비스제공

2. 주요 활용데이터

• 카드사의 소비, 결제정보, 가맹점 정보와 블로그, 카페 등 온라인상의 소셜 데이터를 활용

• 카드데이터는 연간 약 30억건을 축적, 일평균 9백만건 정보를 DB에 보관하고 있음(BC카드)

• 소셜 데이터는 포탈, 커뮤니티, 블로그 및 SNS 등 약 1만개 이상의 다양한 seed web site를 확보하여 일

평균 80만건 이상의 데이터를 모니터링(LG CNS)

3. 분석 내용 및 기법

• 데이터 확보 방법

① 소셜 데이터 수집 및 활용 계획

소셜 미디어 데이터신용카드 거래 데이터

카드 회원Data

가맹점 정보 Data

고객사 네트워크

•3천 6백만명 유효카드 회원

• 연령, 성별, 주소, 연추정소득, 전

화번호, 외국인여부,자동차보유

여부, 취미 등

• 대한민국 전 지역 분포한 261만

개 가맹점 데이터 보유

• 가맹점명,사업자주소,가맹점주

소,전화번호,대표자정보,연평균

매출금액 등

• 은행, 증권, 카드 30개사 네트워크

• 우리카드,대구은행,IBK기업은행,

현대증권,우체국 등

Page 49: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

49

비씨카드 컨소시움

- LG CNS는 소셜 데이터를 확보하여 저장하고 있음, 데이터 수집이 허가된 도메인만 수집하므로 기

관과의 별도 협의는 불요(기존에도 운영하던 방식)

- 소셜 데이터의 특성상 개인식별정보에 대한 정확한 식별 불가능, 개인정보 수집 금지 사이트의 경우

Crawling 단계에서 미리 인지하여 대응하므로 개인정보 수집의 이슈는 없음

- 소셜 데이터 수집은 Seed site기반으로 키워드 중심으로 수집

개인 정보 보호 방안 | Social 데이터

소셜 데이터 수집 기술 현황 | 크롤링, Crawling

•멀티서버 구성

- 부하분산 : 검색서버, 색인서버 분리

- Fail over : 시스템 다운 시 Replication 서버로 대응

•데이터 무결성 구성

- 색인 데이터 로깅 트랜잭션 무결성에 대한 보장

•보안

- 수집문서 바이러스 검사,

해킹 모니터링

•공개키 방식 SSL 인증서 적용

- 통신 내용이 공격장에게 노출되는 것을 막을 수 있다.

- 클라이언트가 접속하려는 서버가 신뢰할 수 있는 서버인지를 판단할 수 있다.

- 통신 내용의 악의적인 변경을 방지할 수 있다.

•Compliance Issue 관련

- 전체 수집 도메인에 대한 전수 조사를 통해 수집 가능여부 판별(robot.txt)

- 도메인별 수집 가능여부 현황 관리 수행

•개인정보 보호

- 전체 전송 데이터에 정규식을 통한 개인정보변환 작업 수행(***@gmail.com)

- 개인정보 field의 수집 제외

※ 정규식 패턴으로 잡아낼 수 없는 변형된 개인정보의 제거에는 한계가 있습니다.

Page 50: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

50

- Text Analytics를 위해서는 Contents Categorization, Text Mining, HunT 솔루션을 대표적으로 텍스트

분석에 활용함

② 카드 데이터 활용

- 카드 결제 정보는 소비트랜드를 대표하는 집단의 속성이 소셜데이터를 통해 도출되면 이를 타겟팅

에 활용, 분석 단계에서 개인 정보가 포함되지 않은 통계적 데이터를 활용함

- 마케팅 시행의 경우에도 마케팅에 동의한 고객을 대상으로 하므로, 개인정보의 이슈는 없음(마케팅

미동의 고객은 자동으로 필터링됨)

- 소셜 세그멘테이션은 고객의 소비 패턴에 따라 1명의 고객이 n개의 세그에 포함이 가능, 유사한 소

비 특성을 보이는 집단을 타겟으로 한 마케팅 적용

소셜 데이터 분석 기술 현황

소셜 타겟팅기존 타겟팅

• 문건의 속성별 분류

• 각 주제별 긍/부정

파악

• 문건의 주제파악

• 용어 및 핵심

키워드 추출

• 용어간 연관관계

분석

• 문서의 집합을

대상으로 품사별

키워드 추출

넥스

트 분

석 솔

루션

• 텍스트로 되어 있는 문건의 Semantic 구

조를 파악하기 위해 자연어처리(NLP) 및

Advanced Linguistic 기술을 적용하며 이

를 통해 방대한 양의 Text data를 자동적

으로 분류함

• 공통 단어 추출 및 발생 빈도에 따른

weight값 자동 부여

• 논리적인 클러스터링 통해 문서들 간의

연관관계를 인식하여 숨겨진 정보를 파악

• 형태소분석기와 상용자사전을 반영하여

품사별 키워드 추출

• 분석 속도가 매우 빠르며, 사용자사전, 불

용어사전을 통해 정확도 보완 가능

주요 분석 내용 주요 기능

Page 51: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

51

비씨카드 컨소시움

- 온라인(소셜 데이터)상에서 고객이 언급한 업종에 가깝게 마케팅 오퍼를 매칭하여 관심도를 높이며

기존 마케팅과의 오퍼 차이는 아래와 같음

•전체 프로세스 정의

- 소비트랜드 분석 및 예측은 소셜 데이터를 활용한 트랜드 프로파일링 작업과 카드데이터/소셜데이터

를 연계하는 알고리즘 개발을 통한 새로운 마케팅 기법

#소비트랜드

분석 및 예측

보고서

(profiling D.L.S.S)

#마케팅결과

(1~3차 테스트

마케팅 결과지표)

#AIPS(Artificial

Intelligenceprofiling System)

• 소셜 빅데이터 활용한 소비

트랜드 대표집단 속성 육하

원칙 정의

• 15.6 ~15.7월

• 소셜 데이터(Social Media

Data) 분석

• 소비트랜드별 프로파일

도출(Dynamic Life Style

Segmentation)

• ~15.8월

• 소셜 데이터의 정형화

• 카드/소셜데이터 연계 매핑

Key값 도출, 연관 소비패턴

도출(주성분분석 활용)

• ~15.9월

• 카드/소셜 데이터 연계 방법

론 도출 및 테스트

• 소셜데이터 활용한 타겟 마

케팅 기획 및 테스트 적용,

마케팅 결과 분석

• 15.9 ~10월(완료)

• 2개 회원사 테스트 마케팅

적용

소셜 오퍼 매핑기존 오퍼 매핑

1. 트랜드 맵구성

2. 트랜드 프로파일

3. 알고리즘 개발(AIPS)

4. 마케팅 세일

추진내용

타겟 고객 타겟 고객마케팅 오퍼 마케팅 오퍼

산출물일정, 주요작업

Page 52: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

52

• 소비 트랜드 맵 도출 방법

- 소셜 데이터를 활용하여 소비트랜드를 대표하는 집단의 속성을 도출함

- 소비트랜드별 연관 키워드 기반으로 소셜 데이터 분석하여 Map을 도출함

[그림] 아울렛 아우팅 소비 트랜드 맵

트랜드 별 데이터 셋 구성

식스포켓키즈 소비 분석 데이터

1. 가족과의 주말여행

그리고 쇼핑도 함께 고려 2. 다양한 브랜드와

아이템쇼핑

3. 쇼핑 후 나들이 활동으로 연장

할아버지할머니손자손녀조카이모삼촌고모...

선물

사다

사주다...

소셜 데이터(Social Data)

각 트랜드별 키워드 정의

트위터, 블로그 등과 같은

소셜 네트워킹 서비스(SNS)에

가입한 이용자들이 의견과 정보를

공유하면서 온라인상에서

언급하는 이야기들

주말 이벤트로서의 나들이처럼 떠나는 아울렛 쇼핑 ▶ Outlet Outing 소비

쇼핑

+가족

101,575

Page 53: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

53

비씨카드 컨소시움

[그림] 직장인나홀로 소비 퇴근이후 시점 트랜드 맵

• 트랜드 프로파일링 작업 방법

- 트랜드 맵을 통해 포착된 정보를 향후 카드데이터와 연계하기 위한 사전 작업 시행

트랜드 프로파일링(Trend Profiling)

8. 짬짬이 취미생활

6. 기념일 챙기기

7. 매일매일 기념일

9. 건강을 위해 10. 애완동물과 함께 1. 불금칼퇴

2. 장보러 가야지

3. 술 한잔? 치맥!

4. 영어학원 열공!

5. 아무것도 안하고 싶다

프로파일링(Profiling)

원래의 뜻은 자료 수집이나,

수사용어로는 범죄유형분석법

→ 범죄 현상을 분석해

범죄의 습관, 나이, 성격, 직업,

범행 수법을 추론한 뒤

이를 바탕으로 범인을 찾아내는

수사기법

각 소비트랜드를 대표하는 집단의

속성을 추론하여 유형화하는 작업

(비식별정보의 식별화,

비정형데이터의 정형화 작업)

Page 54: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

54

- 모양이 일정하지 않은 소셜 데이터의 형태를 잡아주기 위해 육하원칙 기반으로 소비행태를 정의함

[그림] 프로파일링 작업 예시

• 오늘 13개월 된 조카 어린이날 선물로 원피스를 사면서 애

기 옷 고르는 행복함을 알았다. 작고 부드럽고 말랑말랑한

애기에게 예쁜 옷을 입히는 엄마의 마음이란!!!!!!!!!!!!!

• 제 조카가 이번에 졸업을 해요 그리고 대딩이 되죠.. 졸업식

날 이쁜 꽃 사달라는데 사실 전 첨 성인이 되는 조카한테 특

별한 선물을 해주고 싶거든요 머니머니해도 돈이 제일 좋지

만서두 쓰고나면 없어질 돈보단 첫 아가씨 입성하는 그런

선물을 사주고 싶은데..머리가 안돌아가요..저에게 특별한 큰

조카에요 조카를 엄마가 키워주셔서 저랑 같이 살았거든요

그래서 그런지 다른 조카들보단 더 많은 정이..♡

• 올해 고등학교 올라가는 조카 선물 주려고 하는데요. 태블

릿 PC어때요? 많이 쓰나요? 30만원대에 살 수 있던데 이정

도 가격선에서 추천할만한 선물 머 없을까요? 시누들이 너

무 잘해줘서 하나씩 선물 해드리고 싶은데 애들께 낫겠죠?

고등학교 아이들을 두신 어머님들~~ 추천해주세요 ̂ ^

• 조카 생일 선물로다 버버리 원피스 하나 샀어요. 8y가 딱 맞

을거같서 10y로 샀어요. 신규는 없어서 걍 무배적용 받구요.

사쥬때매 벌써 걱정이네요^ ;̂;

• 안녕하세요 조카 선물로 독일 유모차를 구입하려고 합니다

어디를 가야 다양한 종류를 보고 가격대도 저렴한 곳으로

추천해 주세요 브랜드도 어떤게 좋은지요

•호칭 : 고모, 할아버지, 조카

• 연령 : 연령을 알 수 있는 단

어는?

•직장 다니는, 선생님,.. • 백화점, 마트, 아울렛,

온라인몰 등..

•정장, 아동복, 장난감

• 야마하 피아노, 랑콤에센스

소셜 트랜드 기반 분석한 소비 트랜드 정보

온라인상에 언급되는 식스포켓키즈 소비 관련

소셜 데이터 원본육하원칙 기준 정의

Who they are (Summary)

Demography 종사하는 업태(직업) 장소

•생일, 입학식, 졸업식

•명절, 월급날, 기념일..

•지출 규모가 작은, 큰

• 사치품, 명품, 일반 생활

용품…

• 필요해서, 선물하려고

•좋아서, 예뻐서, 보여서…

구매 시점 소비 규모 구매 이유

선호브랜드 / 구매물품

누가? 할아버지, 할머니

무엇을?고가의 가구,

귀금속, 컴퓨터

언제?명절, 생일

→ 대체로 특정 이벤트 없이 분포

어디서?어떻게?

백화점, 아울렛제품 별 전문 매장

동행 방문

왜?사주고 싶어서,

선물 하려고..

Page 55: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

55

비씨카드 컨소시움

- 식스포켓키즈 소비라는 트랜드 기준으로 프로파일링을 진행하면 아래와 같은 소셜 세그멘테이션

(Social Segmentation)이 도출됨

# Seg. WHO WHAT WHERE WHOM WHEN

1

딸(며느리)만족

을 위한 노년층

수동형 소비

할아버지

& 할머니

스토케 유모차,

장난감, 드레스,

전동차 (붕붕카)

: (딸 또는 며느

리가 평소 갖고

싶었던 아이템)

백화점, 마트,

온라인, 아울렛,

멀티플렉스

손주

졸업, 입학, 생일,

크리스마스,

새해

2

나의 만족을

위한 노년층

능동형 소비

할아버지

& 할머니

드레스 등 의류

및 신발, 가방 백화점, 마트 손주 상시

3아빠와 나 충동

형 소비

여보, 남편

(아이 아빠) 장난감

테마파크, 마트,

멀티플렉스 자녀+조카 주말, 공휴일

4조카바보

워너비 소비

나 (미혼 남성

또는 미혼 여성 )

돌선물, 입학선

물, 졸업선물

(특정 아이템이

아닌 시즌 언급),

장난감, 전집

백화점, 온라인,

홈쇼핑 조카

입학, 졸업, 생일,

크리스마스,

새해

5Travel lover

이모 소비

나 또는 이모

(미혼 여성)

주요 해외 브랜

드의 옷, 신발,

장난감

해외 스토어 조카 상시

6해외직구 맘

(mom) 소비 나 (기혼 여성)

주요 해외 브랜

드 (폴로, 갭 등) 온라인 자녀+조카 상시

7Family traveler

소비

할아버지,

할머니를 포함

한 가족 전체

현지 해외 브랜

해외 현지

스토어

손주

(또는 조카)해외 여행 시

8DIY 정성 조카

바보족 소비이모 또는 고모

곰인형, 내복(옷),

모자,캐리커쳐

조카

(신생아) 출산 (탄생)

9웰컴 투 패밀리

소비

할아버지,

할머니를 포함

한 가족 전체

임신 & 출산용품 백화점, 마트, 온

라인, 홈쇼핑 등

손주 또는 조카

(신생아) 출산 (탄생)

10조카 친밀형

소비

이모, 고모 삼촌,

고모부

화장품(특이점),

장난감 등

백화점, 온라인,

홈쇼핑 조카

입학, 졸업, 생일,

크리스마스,

새해

Page 56: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

56

주요 분석 결과 및 활용방안

1. 주요 분석 결과

• 정형, 비정형 데이터 연계 방법 개발

- 정형, 비정형 데이터 연계가 어려운 것은 카드 데이터와 소셜 데이터의 형태가 달라 이를 연계할 수 있

는 Key값이 없기 때문, 이 방법론을 도출하여 마케팅까지 적용한 것이 시범사업의 의의

※ AIPS(아입스, Artificial Intelligence Marketing Profiling System) 개발

• 연계 분석 방법의 개발

- 소셜 데이터를 육하원칙 기준으로 분류한 자료 기반으로, 카드 데이터 연결이 가능한 매핑 키 값을 탐

색, 연계 가능여부를 테스트 함

- 언제, 어디서 등 수많은 테스트를 시행하여 소셜 데이터에서는 무엇을(What)에 해당하는 업종 정보를

연계 Key값으로 선정

정형 데이터(structured data)

일정한 형식이나 틀을 가지고 있는

데이터

비정형 데이터(unstructured data)

이메일, 트위터, 블로그처럼 모바일기기

와 온라인에서 생성되는 일정한 규격이

나 형태를 갖지않은 데이터

분석 방법 분석 방법

CC주1) 기존 Seg 연계

가맹점 명

카드사용 월

고객 소비규모

직종

TC주2)

TC

TC or CC

(Who, Whom) (Who)

(What)

(When)

(What, Where)

(When)

감성 사전으로분류가능 여부 검증

주1) CC : Contents Categorizer의 약자. 설계한 Text 모형에 따라 문서를 분류함

주2) TC : Topics Clustering으로 주제단어 Grouping을 분류함

카드 거래 데이터 소셜 데이터

정형 데이터

SocialData

CardData

비정형 데이터

육하원칙 행태 추정

Rule Based Mapping

Demography

업종/가맹점(브랜드/구매 물품)

구매 이유

종사하는 업태(직업)

소비 규모

구매 시점

연계 Key

Page 57: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

57

비씨카드 컨소시움

• 업종코드 매핑 작업 시행

- BC카드 업종의 신 분류 : BC카드 업종을 업태 식별이 가능하도록 기존에 사용하던 컬럼 4개를 조합하

여 신업종코드를 생성하여 매핑에 활용함

- 소셜 데이터 업종과 카드 업종체계를 연계하기 위한 업종코드 매핑 작업 시행

2. 테스트 마케팅 시행 계획

• 1차 테스트 마케팅 기획 및 실행

- 위의 분석한 내용을 바탕으로 다양한 테스트 마케팅을 계획하여 그 성과를 검증해보고자 함

마케팅 기간 카드이용금액 6.3% ⇡

세그별 인당 이용금액 최대 3만 4천원 ⇡

목표 금액 달성 고객수 11.3% ⇡

(마케팅군 562명, 비교군 505명)

소셜 데이터1 : n

예시적

카드 데이터

소셜에서 많이 언급한 업종과 유사한 모바일 상품권

카드 데이터에서 많이 소비한 업종과 유사한 상품권

각각 매칭

식스포켓

37대 소셜 업종 분류식스포켓대상 식별인자 업종 도출

(가맹점니즈업종코드 + 대분류명 + 중분류명 + 가맹점융합DB업종명)

테스트 마케팅 결과1차 테스트 마케팅 개요

Page 58: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

58

- 1차 테스트 마케팅은 기존 BC카드의 26개 고객 세그멘테이션 중, 식스포켓키즈 연관업종 소비를 많이

보이는 4개의 세그멘테이션 고객을 대상으로 하여 시행

- 소셜 및 카드 연관 업종을 마케팅 오퍼를 매칭하여 약 1만명 고객을 대상으로 진행 함

• 2차 테스트 마케팅 기획 및 실행

- 2차 테스트 마케팅은 약 2만명을 대상으로 기존 카드 세그멘테이션과의 연계없이 이번 과제의 분석 결

과만을 활용하여 테스트 함

- 카드 / 소셜 연관 업종 소비 패턴을 보이는 집단을 타겟으로 하고 소셜 상에서 관심있게 언급한 업종,

카드데이터에서 소비를 보인 업종을 각각 마케팅 오퍼로 매칭하여 그 효과를 검증함

• 3차 테스트 마케팅 기획 및 실행

- 3차 테스트 마케팅은 약 7만명을 대상으로 진행함, 12일간 진행한 단기 마케팅임에도 불구하고 오퍼

반응율 6.3% 달성, 약 7천 6백만원의 수익 발생 효과를 얻음

그룹오퍼반응

총매출(B)매출이익

(C=B*1%)수익

(C-A)대상 고객수반응 고객수 반응율 오퍼비용(A)

❶ 의류잡화, 자전거 5,707명 383명 6.7% 3,830,000 1,100,076,420 11,000,764 7,170,764

❷ 의류잡화, 유아용품 2,437명 182명 7.5% 1,820,000 466,100,010 4,661,000 2,841,000

❸ 교육도서, 놀이체험 7,378명 462명 6.3% 4,620,000 1,331,379,255 12,313,793 8,693,793

❹ 놀이체험, 전시공연 체험 30,001명 2,058명 6.9% 20,580,000 5,426,628,118 54,266,281 33,686,281

❺ 유아용품, 전시공연 체험 25,536명 1,405명 5.5% 14,050,000 3,860,221,125 38,602,211 24,552,211

합계 71,059명 4,490명 6.3% 44,900,000 12,184,404,928 121,844,049 75,944,049

카드 이용금액 약 9억 증가 인당 이용액 약 4만원 증가 목표달성 고객 약 3백명 증가

카드 이용 금액 인당 평균 이용액 목표 달성 고객수

동일한 소비패턴을 보이는 고객 집단 중 일부에 마케팅을 적용,

마케팅을 적용하지 않은 일반 그룹과 행사기간(10.1~11일)내 매출 변화 비교

• 매출이익을 총 매출금액의 1% 가정한 경우

Page 59: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

59

비씨카드 컨소시움

• 1~3차 테스트 마케팅 결과 요약

- 3차례 진행한 테스트 마케팅 결과를 확인하기 위해 전월, 전년동기 대비 기존 정기 캠페인과 비교하여

효과가 있는지 확인함

- 마케팅 결과를 분석할 때 가장 일반적으로 사용하는 마케팅 승수를 계산하여 비교함 (마케팅 승수: 마

케팅에 투여한 비용 1원당 얼마만큼의 매출증대 효과가 있었는지 보는 지표로, 마케팅기간에 발생한

카드 이용금액에서 전월 동기간 발생한 카드이용금액을 뺀 차액을 마케팅에 투여한 비용으로 나누어

계산함)

구분캠페인기간

전월동기간

전년동기간

마케팅 승수마케팅 비용

전월 전년

1차 마케팅 9억 8천 7억 9천 7억 33.90 49.10 5백 6십만원

2차 마케팅 59억 1천 55억 5천 38억 9천 17.81 101.55 1천 9백만원

3차 마케팅 127억 2천 113억 8천 108억 29.67 42.66 4천 4백만원

3. 소셜 데이터 활용한 마케팅 효과

• 소셜 데이터를 활용한 마케팅이 고객 타겟팅에 효과가 있는가?

- 소셜 빅데이터 분석 활용하여 타겟팅한 2차 마케팅의 반응율이 1차 대비하여 2.8%p 더 높음

Offer

Target

마케팅 반응률

1차 테스트 마케팅 2차 테스트 마케팅

• 전월 마케팅 승수 = (캠페인 기간 금액 - 전월 금액) / 마케팅 비용

• 기존 6개 정기적인 upsell 마케팅 전월대비 평균 마케팅 승수 : 15.86

(캠패인코드 : 저실적활성화 캠페인 4개, 모집인 모집카드 캠패인 2개 포함한 6개 캠페인 평균)

Page 60: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

60

• 소셜 데이터를 활용한 마케팅이 특히 어떤 고객층에서 반응이 좋은가?

- 체크카드 고객이 ‘소셜 연관 오퍼’에 더 높은 반응을 보이는 것으로 분석됨, 이는 20~30세대 젊은층이

온라인상에서 언급된 주요 업종 오퍼에 더 높은 관심을 보이는 것으로 분석

4. 서비스 계획 및 활용방안

• 카드, 소셜데이터 연계 방법 개발

- 주성분 분석과 유클리디안 거리 측정을 통한 연계 알고리즘 구상(통계기법)

※ 주성분 분석(PCA, Principal Component Analytics) : 일반적인 통계 데이터 분석 방법으로 분포된 데이

터들의 주 성분을 찾아주는 기법, 어떤 분포를 설명하는 많은 요소들이 있을 때 이 중 가장 설명력이

높은 일부의 속성을 분석하는 방법

[그림] 주성분 분석을 통한 계수 산출 예시

주성분 분석을 통한 계수 산출

카드 데이터

일시불그룹별 비교 할부 체크

소셜 데이터

소셜 오퍼 매칭한

마케팅 그룹

카드 오퍼 매칭한

마케팅 그룹

카드 오퍼 매칭한

마케팅 미적용 그룹

Page 61: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

61

비씨카드 컨소시움

※ 유클리디안 거리측정(Euclidean Distance) : 중심 값에서 변수가 갖는 거리를 측정하는 통계 분석 기법,

거리 값이 작을수록 소셜 데이터에서 언급하는 비중과 카드 데이터 매출 비중이 유사한 것으로 볼 수

있음

[그림] 유클리디안 디스턴스 분석 결과 예시

카드 Only 소셜 Only

상대적으로

설명력이 높은

6개 집단 선정

카드 & 소셜

Page 62: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

62

기대효과 및 사업 활용 방안

1. 소셜 트랜드 마케팅의 정성적 효과

- 비정형 데이터를 금융업에 활용하는 방법을 도출하고 이를 마케팅에 적용한 업계 최초의 사례임

2. BC카드의 30여개 고객사 대상 빅데이터 활용 마케팅 확산

- 2015년 IBK기업은행 고객 대상 2차례 테스트 마케팅, 대구은행 고객 대상 1차례 테스트 마케팅을 진행함

- 두 곳 은행은 내년도에도 협력하여 소셜 데이터 활용한 트랜드 마케팅을 진행하기로 협의, 신규로 우리카

드도 2016년 사업계획에 비정형 빅데이터 분석 내용을 반영하여 진행 예정

[그림] BC카드 고객사 현황(현재 기준)

개인정보보호법 등 규제로 인한 산업간 Data 제휴어려움을 극복할 수 있는 방안을 제시

새롭고 정교한 소비트랜드 기반 빅데이터 마케팅 가능

실물결제 동향을 분석 및 예측하여 각 산업에제공 가능한 모델 제시

Page 63: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

63

비씨카드 컨소시움

3. 금융 산업 내 전파 상세 계획

- 카드사, 시중은행 및 지방은행, 국가기관 등에 AIPS 관련 설명회 시행 및 내용 전파 완료, 2016년 사업계

획 수립 지원

4. 금융산업 이외 타산업으로 전파 계획

- 금융산업 내 전파에서 나아가 외부기관에 대한민국 실물경제에 대한 설명력을 높일 수 있는 빅데이터 분

석 및 예측 서비스 확대 예정

- 2015년에는 빅데이터 분석 역량 내재화 및 내부 마케팅에 활용하였다면, 2016년 부터는 외부기관 데이터

와 연계한 공동사업 수행, 산학협력 연구 등으로 확장

5. AIPS 활용 방안

- 내년도 비정형 빅데이터 활용한 소비 트랜드 분석 및 예측으로 카드, 은행, 증권사 확대 적용하여 시범사

업에서 본 사업으로 서비스 본격화 예정

우리카드카드사

시중은행

기타

한국씨티은행

IBK기업은행

대구은행

우체국(금융개발연구원)

• AIPS 관련 우리카드 방문 1차 설명, ‘15.9월

• ‘우리카드 2016년 빅데이터 사업계획 추진(안)’ 관련협회 15. 11. 18일

- ‘16년 빅데이터 계획 수립 시, BC카드 본 시범사업 내용 참조

ex. 비정형텍스트 데이터 분석 노하우 축적(-6월),

내/외부 텍스트데이터 및 승인데이터 분석을 통한 인사이트 도출(-9월),

빅데이터 기반 파일럿마케팅 수행(~12월)

• 우리카드 직원 대상 AIPS 설명회 시행, 12.17일

• AIPS 관련 언론보도 접한 후, 성과전시회 발표자료 등 자료 공유 요청

• 카드사업부 협의(9~10월), 테스트 마케팅 결과 언론 보도, ‘15.11월

• 내년도 빅데이터 트랜드 마케팅 사업 의사 밝힘, ‘15.12월

• 테스트마케팅 시행(10월) 및 결과 보고, ‘15.11월

• 내년도 빅데이터 기반 마케팅 계획사업계획서 반영함

• 성과전시회 참여 후, BC카드로 발표자료 공유 요청 및 AIPS 관련 분석 방법 문의

Page 64: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

64

Lessons Learned

많은 카드사들이 빅데이터를 도입하였지만 대부분 카드사 내부의 매출데이터 분석에 중심을 두고

있음 본 과제는 소셜데이터와 카드사의 내부의 빅데이터를 결합한 업계최초의 시도로 소셜데이터

안에 숨겨진 소비 트랜드를 발굴하고 타켓 마케팅을 수행하여 성과를 증명하였음. 업계에서는 소셜

데이터에 대한 회의론도 나오고 있는 형편이지만 이는 그 안에 숨겨진 현상을 이해하지 못하는데 따

른 것으로 정형데이터와 결합하여 분석하면 유의미한 결과를 얻을 수 있음을 증명

‘16년 사업 추진 방향‘16년 이머징 트랜드 내용

비정형

데이터

분석 강화

AIPS 활용 마케팅 대상 회원사 확대

비정형데이터 활용 방안 연구 AIPS 고도화

AIPS활용

회원사 마케팅

지원 확대

• 소비트랜드별 소셜 데이터 활용한 분석

• 유의미한 마케팅 인사이트 도출

• 비정형 데이터 분석 및 활용방안 지속연구

• 고령화 및 1인 가구 증가로 스마트

폰 등 IT기기 활용한 건강관리 소비

움직임

• 중국 뿐 아니라 필리핀 등 동아시아

권 소비자 성장과 디지털 기술 발

달, 국내 외국인 소비 문화

• 기업의 광고보다 개인 소비자의 경

험을 신뢰, SNS상 다양한 개인 간

거래 및 중개 플랫폼 등장

• 복합 쇼핑몰, 지역 및 거리 축제 등

가까운 곳에서 한번에 문화를 체험

하려는 체험 소비 성장

• 재미와 안심을 추구하는 소비자 증

가로 직접 만들고 참여하는 소비의

전분야 확대

• AIPS활용한 분석 결과 회원사 제공 확대

• 마케팅 제안 및 빅데이터 마케팅 지원

• 마케팅 실행, 결과보고 및 알고리즘 고도화

Page 65: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

65

비씨카드 컨소시움

<참고> 조선일보 에잇포켓키즈 트랜드 언론 보도

“아이를 위한 돈이 8명 주머니서 나와“ 불

황에 소비 심리 줄어도 손자·조카에 지

갑 열어 최근 ‘에잇 포켓 키즈(8-Pocket

Kids)’라는 말이 마케팅 업계에서 새 화두

(話頭)로 떠오르고 있다. ‘에잇 포켓 키즈’

는 아이를 위해 쓰는 돈이 부모 외에도 친

할아버지·친할머니, 외할아버지·외할머

니의 호주머니에서 나온다는 ‘식스 포켓 키즈(6-Pocket Kids)’에 미혼의 삼촌·고모(이모)까지 더

해져 아이를 위한 돈이 8명의 주머니에서 나온다는 뜻의 신조어다. BC카드 빅데이터센터가 올해

1월부터 4월까지 소셜네트워킹서비스(SNS) 빅데이터를 분석한 결과 이 같은 경향이 두드러졌다.

삼촌·고모(이모)와 조카의 연관어 키워드는 총 6만8739건으로 할아버지·할머니 등과 손자의 연

관어 19만3236건의 35.5%에 달했다. SNS 빅데이터 분석은 블로그, 인터넷 카페, 페이스북, 트위

터 등 SNS상에서 할아버지, 할머니, 손자, 손녀, 조카 등 호칭 ‘키워드’와 ‘선물’ ‘사주다’ 등 소비와

관련된 연관어를 결합해 분석하는 방식이다. 예컨대 아이의 부모가 자신의 SNS에 ‘○○이(아이 이

름) 삼촌이 ○○이에게 해외에서 직구(직접 구매)한 한정판 레고를 사줬어요’라는 글을 올리면 ‘삼

촌이 조카에게 레고를 사줬다’는 분석이 가능하다. SNS 분석 결과 삼촌·고모는 졸업이나 입학 등

특정한 날을 계기로 어떤 선물을 줄지 고민한 다음 온라인 쇼핑, 해외 직구, 백화점 등 구매처를

결정하는 3단계 소비 패턴을 보이는 것으로 나타났다. 반면 할아버지·할머니는 ‘예뻐서’ 혹은 ‘사

주고 싶어서’ 등 특별한 계기나 이유 없이 아이와 함께 백화점 등에 가서 선물을 사주는 단순한 패

턴을 보였다. 또 삼촌·고모는 원피스, 레고, 로봇 등 장난감과 의류를 중심으로 선물을 선택했지

만, 조부모는 책상, 목걸이, 컴퓨터 등 상대적으로 비싼 가구나 귀금속을 선물로 골랐다.BC카드 승

인 자료 역시 ‘에잇 포켓 키즈’ 현상을 뒷받침한다. 올해 상반기 고모·삼촌 등에 해당하는 미혼의

20·30대 카드 사용자는 아동 의류 업종에서 47억4200만원을 썼다. 이는 지난해 같은 기간 32억

원 대비 48.7% 증가한 수치다. 조부모로 추정되는 50대 이상의 아동 의류 업종 카드 사용 증가율

15.4%의 3배가 넘는다. 장석호 BC카드 빅데이터센터장은 “장기 불황으로 소비 심리가 위축될 것

이란 전망에도 조부모들은 물론 고모·삼촌은 손자·조카에 대한 지출을 줄이지 않는 것으로 보

인다”고 말했다.

[팝업 경제] 부모·양가 조부모에 고모·삼촌도 가세…

'에잇 포켓 키즈' 마케팅 업계 새 話頭로

Page 66: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

66

사업의 추진 배경 및 목적

1. 사업 추진의 배경

• 전력공급에 소요되는 사회적 비용이 급증하여 빠른 속도로 증가하는 수요를 충족시키는데 많은 어려움과

많은 비용이 소요됨

• 늘어나는 전력 수요에 따라 공급을 확대하는 공급중심 정책에서 합리적으로 수요를 줄인 후 공급을 확대

하는 수요관리 중심 기술 필요

• 실내온도 제한 등 일시적 절약에서 벗어나, 그린ICT 기술을 활용한 근본적이고 시스템적인 수요관리 추진

필요

• 중·소규모 프랜차이즈형 점포를 운영하고 있는 소상공인들의 전기료에 대한 부담 가중

• 국내 총 전력소비량 및 상업용 전력소비증가율이 급격히 증가하고 있음으로 전력 에너지에 대한 절약 및

효율적 운영 필요

[자료: 지경부공고 제2013-63호, 2013. 02. 25]

04 빅데이터를 활용한

스마트 에너지 관리 서비스BIGDATA시 범 사 업

2002

(2002-100)

0

100

200

300

400

500

600

2003 2004 2005 2006 2007 2008 2009 2010 2011

용도별 전력소비량 변화[2002=100 기준]

주택용 상업용 산업용

Page 67: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

67

2. 사업 추진 목적

• 추진 목적 및 기대효과

추진 목적 및 기대효과

비전 • 에너지 수요관리 시스템화를 통한 에너지 저소비 고효율 전력사용 사회구현

목표

• 매장에 능동적이고 효율적인 쾌적 Energy Management System 구성

• 프랜차이즈 등 중·소상점의 예측가능하고 효율적인 에너지관리체계 구현

• ICT기술과 전력시장을 창조적으로 융합하여 에너지 수요관리 신산업 창출

세부추진

• 매장에 최적화된 에너지 관리 시스템 구축

• 중·소 상점용 EMS 설치 확대 유인

• EMS 제작. 공급 기반강화 및 에너지 수요관리 서비스 기업 육성

ICT• 매장 환경 및 외부 환경 데이터 기반의 빅데이터 패턴 분석 / 도출

• 빅데이터 분석에 따른 최적의 에너지 절감 알고리즘

• 사업의 기대효과

- 기존의 대규모 에너지 절감 시스템의 비효율성 배제

- 단일 대형건물 / 공장 위주의 EMS에서 중·소매 점포용 EMS 소형화

- 중·소규모 점포용 에너지 절감 시스템으로 ROI(Return On Investment) 개선

- 시계열 알고리즘(SARIMA)을 통한 예측분석 및 시각화

- 빅데이터를 활용하여 기존의 IoT와 융합을 통한 최적의 제어 구현

공공·이동통신사 및 프랜차이즈 가맹점의 유동인구, 매출 등의 빅데이터를 융합·분석하여

냉·난방 기기를 효율적으로 활용할 수 있는 스마트 에너지 관리 서비스를 구축

에스지에이 컨소시움

Page 68: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

68

3. 사업 추진의 필요성

• 비효율적인 중·소 상점의 에너지 사용효율에 대한 기준 필요

- 중·소상인은 환경 특성상 에너지에 대한 관리가 어렵고 자발적인 관리가 미흡함

- 중·소상인 상점 환경과 외부 환경데이터에 맞는 능동적 쾌적 기반 스마트에너지 절감 시스템 서비스

필요

- 실내온도 제한 등 일시적 절전규제에서 벗어나, 그린 ICT와 과학기술을 활용한 근본적이고 시스템적인

관리로 전환

- 전통적인 에너지산업에 소프트웨어 산업을 융합한 그린 ICT기반 에너지산업 시장진출 기회

- 에너지 정책 패러다임을 전환하여 공급중심(수요추종)에서 수요관리 중심의 에너지 정책 추진 필요

- 비효율적인 중·소 상점의 에너지 사용효율에 대한 기준이 필요

- 매년 달라지는 기후와 지구 온난화로 효율적인 냉·난방 시스템의 관리가 더욱 필요

- 정형화 되어있지 않은 고객의 쾌적성에 온·습도를 맞추려 과도하게 냉·난방기가 사용되고 있음

• 프랜차이즈 매장 등의 방문고객의 내방객수/시간대/성별/연령별 분석을 통해 다양한 정책 활용이 가능

• 다양한 프렌차이즈 점포의 특성상 다양한 기상정보 및 고객 정보등을 종합 분석하여 시간대별 에너지 운

영 체계를 제어함으로써 효율적인 에너지 사용이 가능

• 현재까지의 정부 에너지 정책이 다양한 센서들과 고비용의 기반 시설을 필요로 하였으나, 향후 빅데이터

를 활용한 중·소형 규모의 점포 특성에 부합하는 에너지 절감 정책의 필요성 대두

As - Is To - Be

BIGDATA

Page 69: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

69

에스지에이 컨소시움

추진 내용

1. 주관 및 참여기관

SGA, SK텔레콤, 엔코디

• SGA 주관기관, 사업 관리, 외부 용역 관리

• SK텔레콤 상권데이터 제공, 스마트에너지관리시스템 사업화

• 엔코디 스마트에너지관리시스템 개발, 적용처 섭외

2. 주요 활용데이터

구 분 분 류 데이터 양 제공기관

유동인구

성·연령별 유동인구

시간대별 유동인구

요일별 유동인구

약 연 1000억 건 SK텔레콤

카드매출 카드매출 추정 연 약 5억건 SK텔레콤

주간상주인구 주간에 근무하는 직장인 인구 400만건 SK텔레콤

주거인구 주민등록상 거주인구 500만건 SK텔레콤

상가 / 업소 정보 상가 / 업소 DB 약 300만건 소상공인진흥공단

기상 기상정보 약 3만건 기상청

온 / 습도 매장별 장비별 온 / 습도 약 90만건 -

빅데이터 기반의 데이터처리 및 분석으로 에너지효울화/쾌적환경 조성

반 정형 센서 데이터 등 다양한 형태의

데이터 분석이 가능한 플랫폼 필요

실내온도 제한 등 일시적 절약에서 벗어

나, 빅데이터 기술을 활용한 근본적이고

시스템적인 수요관리 추진 필요

늘어나는 수요에 따라 공급을 확대하는 공급중심

정책에서 합리적으로 수요를 줄인 후 공급을 확대

하는 수요관리 중심 기술 필요

전력공급에 소요되는 사회적 비용이 급증하여 빠른

속도로 증가하는 수요를 충족시키는데 많은 어려움

환경데이터 및 사용자 데이터를 분석

하여 환경에 맞는 사용자 예측 에너지

절감 알고리즘이 필요함

지능형 알고리즘 개발을 위한 대용량

데이터 가공 능력 요구

빅데이터 기반의시스템적 접근 필요

사용자 예측 에너지알고리즘 필요

수요관리 필요성 증대 전력 공급 비용 급증

Page 70: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

70

3. 분석 내용 및 기법

• 데이터 처리 및 분석 기법

• 데이터 분석

① 유동인구 분석

- SK텔레콤의 2740만 이동통신 고객들의 통화, 문자, 인터넷 사용 등의 기지국 단위별 Traffic Data를

기준으로 통화량 데이터와 PCELL 데이터(50M X 50M)의 조인 KEY는 기지국 ID

- 각 Pcell별 비율데이터를 생성하여 각 PCELL에 가중치를 부여하는 알고리즘을 이용하여 성별/연령

별, 시간대별, 요일별 유동인구를 추출하여 8개 각 매장의 주소지를 기준으로 반경 300M의 유동인

구 추출값을 산출, 지수화

② 주간 상주인구 분석

- 2014년도 기준의 직장인 인구 데이터를 8개 시범 매장의 반경 300M를 기준으로 성·연령대별로

추출값을 산출, 지수화

③ 주거인구 분석

- 2014년도 기준의 주거인구 데이터를 8개 시범 매장의 반경 300M를 기준으로 성·연령대별로 추

출값을 산출, 지수화

④ 매출분석

- 현대카드의 업종별 매출통계데이터와 VAN사 의 현금 매출을 보정하여 8개 매장의 반경 300M 기

준의 해당매장 업종의 요일별, 시간대별 2014년도~2015년도까지 매출데이터를 추출하여 요일별

시간대별 예상 매출과 객단가를 추출값을 산출, 지수화

빅데이터를 활용한 스마트 에너지절감 사업의 시범 8개 매장당 예상방문객 및 예상 매출, 객단가

등을 추출하기 위한 분석기법 적용

Page 71: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

71

에스지에이 컨소시움

[그림] 스마트 에너지 관리 서비스 개념도

[그림] 데이터 처리를 위한 시스템 구성도

Geovision 플랫폼 DB 적재 Process

Page 72: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

72

[그림] SK텔레콤의 빅데이터 시스템 구조

[그림] 데이터 분석 과정

매장별 반경 300M

예상방문객 /

예상매출 분석

매장별 반경 300M

데이터 분석

요일별 분석

요일별 분석

시간대별 분석

시간대별 분석

매장별 반경 300M

데이터 분석

유동인구데이터 추출

매출데이터 추출

직장인구데이터 추출

주거인구데이터 추출

Page 73: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

73

에스지에이 컨소시움

• 데이터 분석 과정(SK텔레콤 빅데이터를 활용한 예상방문객 분석)

① 유동인구 추출

- 기지국 단위의 유동인구를 50M X 50M 의 PCELL 단위 인구 산출

- 요일별 / 시간대별 유동인구 추출

- 유동인구에서 주거인구 분포도와 직장인구 분포도를 감안

② 예상방문객 추출

- 월단위 요일별 / 시간대별 매출데이터의 매장 별 반경 300M 지역의 해당업종 매출액과 결제건수,

객단가를 감안 예상 방문객 분석

- 초대마왕 종로점 반경 300M 범위 GIS를 통한 영역을 설정

- 이 영역의 X좌표, Y좌표를 추출하여 유동인구, 주거인구, 주간상주인구, 매출 등의 데이터 추출영역

의 기준으로 선정

[그림] 매장별 300M 범위 데이터 분석

- SK텔레콤 기지국 단위의 데이터를 50M X 50M 의 PCELL단위로 추출하는 과정

- 성·연령별 / 시간대별 / 요일별 유동인구를 추출

Page 74: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

74

[그림] 유동인구 데이터 분석

- 현대카드의 매출통계 데이터를 BLOCK 단위로 추출하는 과정

- 성·연령별 / 시간대별 / 요일별 매출액, 결제건수, 객단가를 추출

[그림] 매출 데이터 분석 과정

- 분석매장의 주간상주인구를 추출하는 과정을 GIS 엔진을 이용하여 분석

- 성별, 연령별 주간상주인구를 추출

통화Data

유입지Data

UniqueData

SKT 고객통화 DB생성

SKT PCELLDB 생성

D/W 생성 D/M 생성

기지국별, 일별,성, 연령별시간대별

기지국별, 일별,성, 연령별

유입지(행정동)

기지국별, 일별,성, 연령별

기지국정보

월별, 성,연령별,유입지별 PCELL

월별, 성,연령별,유입지

월별, 성,연령별,시간대별 PCELL

PCELL비율

성, 연령별유동인구

시간대별유동인구

요일별유동인구

기지국별PCELL 생성작업

분석용MART 생성작업

기지국별, 월별성,연령별,

시간대별 집계

가맹점 DB일별 매출

주소정제공간좌표

부여

현대카드업종 매핑

가맹점 업종매핑 작업

업종별 매출정보

D/W 생성 D/M 생성

상권,업종별매출

상권,업종별매출

상권, 주중, 주말매출

분석용MART 생성작업통계용 DB 생성

월별, 성,연령별,시간대별 매출

월별, 업종별매출

소지역별,업종별, 카드,현금, 보정게수

월 280만 건(2GB)

월 280만 건(2.5GB)

월 280만 건(3GB)

1억건(1GB)

월 4000만건(1GB)일별, 성, 연령별, 시간대별업종별 매출

월 3500만건(2GB)월별, 성, 연령별, 시간대별업종별 매출

월 80만건월별, 업종별 매출

월 100만건월별, 요일별

월 150만건월별, 시간대별

월 400만건월별, 성, 연령별

Page 75: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

75

에스지에이 컨소시움

[그림] 상권별 주간상주인구 추출 분석방법

- 분석매장의 상권영역를 추출하는 과정을 GIS 엔진을 이용하여 분석

[그림] 상권별 추출 분석방법

- 분석매장의 주거인구를 추출하는 과정을 GIS 엔진을 이용하여 분석

- 성별, 연령별 주거인구를 추출

Page 76: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

76

[그림] 상권별 주거인구 추출 분석방법

- 분석매장의 주거인구를 추출하는 과정을 GIS 엔진을 이용하여 분석

- 성별, 연령별 주거인구를 추출

③ 분석결과 활용

- 본 서비스는 중·소형 매장에 에너지 절감을 위한 시스템으로서 데이터 분석결과를 활용하여 각 시스

템 적용매장에 대한 시간당 예상 인원을 예측·추론함으로써 냉·난방기의 효율적인 운전이 가능토록

정보제공

- 시스템 설치 매장의 관리자 및 경영자가 운영 매장 전체의 냉·난방기의 현재 상태 모니터링 및 제

어·통제를 통하여 해당점포의 에너지 절감 시스템 통제 및 제어

Page 77: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

77

에스지에이 컨소시움

주요 분석 결과 및 활용방안

1. 주요 분석 결과(초대마왕 종로점 사례)

• 요일별 유동인구 패턴분석

- 유동인구가 가장 많은 요일은 목요일로서 약 18.8%를 차지하고 있음

• 시간대별 유동인구 패턴분석

- 유동인구가 가장 많은 시간은 14시이며, 약 9.0%를 차지하고 있음

- 점심 시간대가 34.0%로 가장 높은 유동인구 비율을 나타내고 있음

월 화 수 목 금 토0 0

2 2

4 4

6 6

8 8

10 10

12 12

14 14

종로

종로

5,6

가동

인근

16 16

18 18

20 20

종로구 종로5,6가동 인근

종로구 종로5,6가동 인근

0 0

1 1

2 2

3 3

4 4

5 5

6 6

7 7

종로

종로

5,6

가동

인근

8 8

9 9

0시

1시

2시

3시

4시

5시

6시

7시

8시

9시

10시

11시

12시

13시

14시

15시

16시

17시

18시

19시

20시

21시

22시

23시

Page 78: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

78

• 성·연령별 유동인구 패턴분석

- 이 지역의 유동인구는 남성 40대가 15.12%로 가장 많은 비율을 차지하고 있음

- 여성은 50대가 1위로 9.36%를 차지하고 있음

- 상대적으로 남성인구가 여성보다는 높은 비율을 차지하고 있음

• 시간대별 유동인구 패턴분석

- 이 지역의 유동인구는 오후시간대 (14시 ~ 18시)가 50.16%를 차지하고 있음

전체적으로 남성인구 비율이 높은 편이며, 남성은 40대(15.12%) 여성은 50대(9.36%) 인구가 가장 높은 것으로 나타남

유동인구가 가장 많은 오후 시간대 인구를 기준 값으로 심야, 오전, 오후, 저녁 시간대별 유동인구 밀도 변화 분석

10대0

2,000

4,000

6,000

8,000

10,000

12,000

14,000

16,000

20대 30대 40대 50대 60대

0.89%

6.34%

13.76%

15.12%14.83%

10.00%

1.03%

5.88%

7.87%

8.82%9.36%

6.09%

▶ 성 / 연령별 유동인구

성연령 인구 점유율

남성_10대 855.02 0.89%

남성_20대 6,105,29 6.34%

남성_30대 13,242,81 13.76%

남성_40대 14,549,62 15.12%

남성_50대 14,270,45 14.83%

남성_60대 9,621,95 10.00%

여성_10대 991,56 1.03%

여성_20대 5,662,80 5.88%

여성_30대 7,575,32 7.87%

여성_40대 8,490,42 8.82%

여성_50대 9,003,60 9.36%

여성_60대 5,863,64 6.09%

합계 96,232,48 100.00%

시간대 인구 점유율

심야시간 2,462,18 2.55%

오전시간 30,263,52 31.35%

오후시간 48,419,46 50.16%

저녁시간 15,387,37 15.94%

합계 96,532,53 100.00%

남성 여성

심야시간0

10,000

20,000

30,000

40,000

50,000

60,000

오전시간 오후시간 저녁시간

2.55%

15.94%

50.16%

31.35%

Page 79: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

79

에스지에이 컨소시움

• 요일별 유동인구 패턴분석

- 이 지역의 유동인구는 금요일이 18.38%의 가장 높은 비율을 차지하고 있음

- 주말보다는 주중인구가 많이 차지

• 주거인구 패턴분석

- 이 지역의 주거인구는 남녀 모두 60대 인구가 가장 많은 비율을 차지하며, 남성 60대가 11.45%, 여성

60대가 14.52%를 차지

- 그 뒤를 이어 20대 인구가 두 번째로 많은 비율을 차지하고 있음

전체적으로 남성 주거인구 비율이 높은 편이며, 남녀 모두 60대 인구가 가장 높은 것으로 나타남

유동인구가 많은 주중평균 인구를 기준 값으로 주중평균, 주말평균 유동인구 밀도 변화 분석

▶ 주거인구 분석

성연령 인구 점유율

남성_10대 82.48 5.05%

남성_20대 175.61 10.75%

남성_30대 124.71 7.63%

남성_40대 141.36 8.65%

남성_50대 149.30 9.14%

남성_60대 187.14 11.45%

여성_10대 88.72 5.43%

여성_20대 144.74 8.86%

여성_30대 89.26 5.46%

여성_40대 95.51 5.85%

여성_50대 117.90 7.22%

여성_60대 237.31 14.52%

합계 1,634,04 100.00%

요일 인구 점유율

월요일 104,805,33 15.60%

화요일 106,447,85 15.85%

수요일 122,066,84 18.17%

목요일 115,771,28 17.24%

금요일 123,482,38 18.38%

토요일 66,614,46 9.92%

일요일 32,470,95 4.83%

합계 671,659,09 100.00%

요일 인구

주중평균 114514.74

주말평균 49542.71

월요일 월요일 월요일 월요일 월요일 월요일 월요일0

20,000

40,000

60,000

80,000

100,000

120,000

140,000

15.60% 15.85%

18.17%17.24%

18.38%

9.92%

4.83%

주중평균 주말평균0

20,000

40,000

60,000

80,000

100,000

120,000

140,000

10대0

50

100

150

200

250

20대 30대 40대 50대 60대

5.05%

10.75%

7.63%

8.65%9.14%

11.45%

5.43%

8.869%

5.46%5.85%

7.22%

14.52%남성 여성

Page 80: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

80

• 직장인구 패턴분석

- 이 지역의 직장인구는 남성30대가 18.51%와 여성 30대가 14.19%를 차지하고 있음

• 요일별 패턴분석

- 이 지역의 치킨, 바비큐 등 관련 외식 업종의 매출은 목요일이 20%, 금요일이 19.92%를 차지하고 있음

- 주중매출의 비중이 주말보다 높게 차지하고 있음

초대마왕 300m 분석영역 내에 요일별 매출 분석

20대를 제외하고 전체적으로 남성 직장인구 비율이 높은 편이며, 남성과 여성 모두 30대 직장인구가 높은 것으로 나타남

▶ 직장인구 분석

성연령 직장인구 점유율

남성_10대 4.97 0.03%

남성_20대 1,451,40 9.05%

남성_30대 2,968,82 18.51%

남성_40대 2,402,50 14.98%

남성_50대 1,458,31 9.09%

남성_60대 914,57 5.70%

여성_10대 5,25 0.03%

여성_20대 1,848,26 11.52%

여성_30대 2,276,08 14.19%

여성_40대 1,438,03 8.96%

여성_50대 926,52 5.78%

여성_60대 346,82 2.16%

합계 16,041,53 100.00%10대

월요일 화요일 수요일 목요일 금요일 토요일 일요일

0

0

20

40

60

80

100

120

140(백만)

500

1,000

1,500

2,000

2,500

3,000

3,500

20대 30대 40대 50대 60대

0.03%

9.05%

18.51%

14.98%

9.09%

5.70%

0.03%

11.52%

14.19%

8.96%

5.78%

2.16%

남성 여성

요일별

매출

점유율

월요일

70,705,409,42

11.01%

화요일

80,144,188,32

11.01%

수요일

102,800,319,36

16.01%

목요일

128,405,141,77

20.00%

금요일

127,861,766,98

19.92%

토요일

95,421,069,95

14.86%

일요일

36,625,165,90

5.71%

매출합계

641,963,059,70

100.00%

요일별 매출

11.01%

12.48%

16.01%

20.00% 19.92%

5.71%

14.86%

Page 81: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

81

에스지에이 컨소시움

• 시간대별 패턴분석

- 이 지역의 치킨, 바비큐 등 관련 외식 업종의 매출은 21시 부터 상승폭을 보임

- 주로 늦은 저녁이나 새벽까지 매출이 높은 비율을 차지하고 있음

초대마왕 300m 분석영역 내에 시간대별 매출 분석

00시

01시

02시

03시

04시

05시

06시

07시

08시

09시

10시

11시

12시

13시

14시

15시

16시

17시

18시

19시

20시

21시

22시

23시

20.00

40.00

60.00

80.00

100.00

120.00

14000

시간대 매출 점유율

00시 54,291,066,35 8.46%

01시 22,334,432,00 3.48%

02시 15,809,443,55 2.46%

03시 2,778,629,48 0.43%

04시 0.00 0.00%

05시 0.00 0.00%

06시 0.00 0.00%

07시 0.00 0.00%

08시 0.00 0.00%

09시 0.00 0.00%

10시 0.00 0.00%

11시 0.00 0.00%

12시 4,038,494,94 0.64%

13시 2,891,640,35 0.45%

14시 1,790,243,39 0.28%

15시 4,448,157,63 0.69%

16시 4,670,971,97 0.73%

17시 9,618,914,50 1.50%

18시 26,193,373,48 4.08%

19시 66,034,829,14 10.29%

20시 89,824,179,90 13.99%

21시 113,705,237,65 17.71%

22시 126,432,431,28 19.69%

23시 97,101,014,09 15.13%

매출합계 641,963,059,70 100.00%

Page 82: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

82

2. 서비스 계획 및 활용방안

• 자영업자의 소규모 매장 및 금융기관의 무인점포 등 소규모 영업점을 대상으로 에너지 절감 및 매출증대

를 지원하는 서비스

※ 매장 점주와의 개별 계약 및 프랜차이즈 업체와의 일괄계약, 금융기관 무인점포의 경우도 금융기관과

의 일괄계약을 통한 공급 가능

<점주와의 계약을 통한 매장 내 설치 시스템 및 점주대상 지원 App – 모니터링 및 Control>

※ 기존 전력요금액 대비 절감되는 전력요금을 계산하여 절감분의 50%를 수익으로 공유하는 방안으로

으로 추진 중

Page 83: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

83

에스지에이 컨소시움

기대효과 및 사업 활용 방안

•자영업자의 비용절감

- POS Data 및 빅데이터 분석을 통해 방문객 규모를 사전 예측, 전력 사용량 최적화가 가능한 실내 온·

습도 조절

- 초기 투자비용 없이 설치할 수 있어 자영업자 부담이 없는 형태로 진행

•쾌적한 매장 환경 관리 지원 : 고객 만족도 향상

- 고객 수와 무관하게 항상 적정한 온·습도를 유지할 수 있도록 지원, 고객이 쾌적함을 느낄 수 있는 매

장환경 제공

- 매출 및 수익 증대 효과 기대

•에너지 절감 및 탄소배출량 감소

- 550만 명에 달하는 자영업자의 전기절감을 통해 탄소배출량 감소

- 전체 전기 사용량의 21.1%를 차지하는 자영업자의 업소 당 전기 15% 절감 시 국내 전기 사용량을 최

고 3.17%까지 줄일 수 있음

•자영업자 마케팅 지원 및 에너지 절감에 대한 사회적 공감대 확대

- 설치 대상 업소에 에너지 세이브 마크(사업자 자체 브랜드)를 부착하여 자영업자 매장에 대한 인식 재

고 및 매출 증대에 기여

- 정부의 에너지 세이브 마크 지원 시 에너지 절감에 대한 사회적 공감대 형성에 기여할 수 있음

Lessons Learned

기존 IoT센서와 연동하여 실내 냉난방기를 제어하는 시스템은 국내외에서 지속적으로 구축되어 왔

으나, 유동 빅데이터를 분석하여 내방 고객을 예측하여 냉난방을 제어하는 시스템은 시도되지 않았

다. 본 시스템의 주요 성과는 내방 고객들의 쾌적함을 해치지 않으면서도 냉난방비의 가동을 줄이는

것으로, 소상공인의 영업장은 물론 은행 ATM 영업소, 헬스클럽 등에도 적용되어 국가적인 에너지 절

감에 기여할 수 있을 것이다.

Page 84: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

84

사업의 추진 배경 및 목적

1. 사업 추진의 배경

• 국내 전시 산업의 스마트 기술 적용 사례

- 과거부터 RFID, NFC 등 스마트 IT기술 기반 다양한 적용 시도가 있었지만 오프라인 공간에서 적용의

어려움과 기술 수준의 한계로 인해 활성화 미흡

• 데이터 보유 및 활용 현황

- 전시산업은 전시 현장에서 참관객, 참가업체, 전시주최사 등 다양한 참여주체의 활동으로 인해 대량의

데이터가 발생하지만 이를 수집하고 저장, 관리하기 위한 기반이 갖추어 있지 않아 타 산업 분야 대비

낮은 활용도

2. 사업 추진 목적

• 전시산업의 패러다임 전환

- 전시회 전 - 중 - 후 활용 가능한 Total Smart MICE 플랫폼 구축

※ MICE : 기업회의(Meeting), 포상관광(Incentive trip), 컨벤션(Convention), 전시박람회와 이벤트

(Exhibition&Event)

05 빅데이터 기반 스마트

전시컨벤션 서비스 구축BIGDATA시 범 사 업

• 평균 약 4~5일 간의 전시회 종료 후 남는 정보는 참관객의 기본 정보, 일부 상담 실적 수준(신뢰도 낮음)

• 참가업체들은 정량적인 근거나 계획 없이 비효율적인 현장 마케팅 운영

• 전시담당자는 개인 경험이나 노하우에 의존한 기획 업무 수행

국내 전시산업 데이터 수집 및 활용 현황

Page 85: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

85

- 참조모델 기반 전시 업무(기획, 영업 등) 경쟁력 향상 지원

- 데이터 분석의 시사점을 활용해 신규 사업 및 스마트 서비스 개발

- 데이터 수집 및 활용 가치 향상을 위한 플랫폼 업계 확산 추진

3. 사업 추진의 필요성

• 전시회 운영 과정에서 참여주체가 느끼는 불편함

- 참관객 : 입장등록 과정에서의 대기열, 종이 형태의 팜플렛 수집

- 참가업체 : 전시 종료 후 객관적인 성과 측정 필요

- 전시주최사 : 전시회를 효과적으로 운영 / 관리하고 새로운 ITEM 개발 필요

추진 내용

1. 주관 및 참여기관

한화 S&C, 코엑스, 투이컨설팅(위탁) 외 플랫폼 개발 3개사

• 한화 S&C 주관기관, 요구사항 분석, 단위 서비스 개발 및 적용

• 코엑스 비즈니스 요건 정의, 사업 적용 공간 / 대상 제공

• 투이컨설팅 빅데이터 분석, 빅데이터 플랫폼 구축

사물인터넷 기술인 비콘(Beacon)데이터로 참관객의 위치정보를 수집하고 고객 정보와 연계하여

맞춤형 쿠폰 제공 등 다양한 위치기반 서비스를 제공할 수 있는 스마트 전시컨벤션 서비스를 구축

한화 S&C 컨소시움

Page 86: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

86

2. 플랫폼 개발 및 진행 내용

• Smart MICE 플랫폼

- 시범사업을 통해 개발된 Smart MICE 플랫폼은 비콘 디바이스, 참관객전용 앱, 전시주최자 관리시스템

으로 구성

- Beacon Device는 코엑스 전시 전체 Hall(A, B, C, D)에 약 1,800개가 설치 되어있으며 전시 앱에서는 전

시장 길안내, 부스 정보, 위치기반 컨텐츠 푸쉬 서비스 등을 제공

- 참가업체 및 전시주최사는 관리시스템을 통해 각 종 데이터 관리나 이벤트, 컨텐츠를 등록하며 전시성

과 모니터링 가능

[그림] Beacon을 활용한 Smart MICE 플랫폼

[그림] 참관객용 모바일 앱 화면 예시

Page 87: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

87

한화 S&C 컨소시움

•프로토타이핑(전시회 적용 테스트) 수행

- 시범사업 기간 내 플랫폼의 완성도를 높이기 위해 프로토타이핑 방식의 개발방법론으로 진행하였으며

7월 수시정보박람회를 시작으로 10월 서울국제도서전, 국제영상프로기자재전, 11월 서울캐릭터라이

선싱페어 등 총 4회에 걸쳐 수행

3. 주요 활용데이터

구분 분류 주요변수 설명 보유기관

전시

데이터

업체정보 펜스번호, 업체키워드 업체별 키워드 정보

코엑스

펜스위경도정보 펜스번호, 위도, 경도 펜스(업체)의 위치 정보

참관객정보 참관객 시퀀스, 등록구분(바이어/일반) 참관객 등록 정보

참관객방문정보 참관객 시퀀스, 입/퇴장시간, 체류시간 참관객이 업체(부스)를 방문한 정보

※ 2015년 11월 4일~7일까지 열린 ‘서울국제사진영상프로기자재전(P& I Pro)’ 발생 데이터

4. 분석 내용 및 기법

• 빅데이터 분석 모델 선정

- 전시 산업이 당면한 핵심 비즈니스 이슈 해결을 위해 어떠한 행동을 할 것인지 결정하고 그 행동을 통

해 기대되는 결과를 유인하는 Enabler로써 분석주제를 도출

① 분석주제 1 : 실시간 업체 추천

- 전시산업의 특성을 반영, 참관객 방문 유사도에 의해 도출된 선호도 기반의 업체 추천

② 분석주제 2 : 참관객 관심 센싱

- 바이어와 일반 참관객 관심 지수에 의한 매트릭스 구간별 업체와 특징 파악

③ 분석주제 3 : 참관객 동선 분석

- 전시회별 참관객의 주요 동선을 분석하고, 그 중 컨텐츠가 상대적으로 좋았던 업체를 파악하는 분석

Page 88: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

88

• 데이터 처리과정 및 시스템

① 데이터 수집

- 등록된 전시정보 및 업체정보, 참관객이 앱에 등록한 정보, 참관객 업체 방문 정보 등을 전시회 별로

수집

② 데이터 저장

- 서버에 저장된 정보 중 분석에 필요한 정보만 분석 플랫폼에 저장

③ 데이터 분석

- 분석 플랫폼에 적재된 분석 모형에 의해 전시회별로 자동 분석 실행

• 데이터 분석 기법 및 분석결과 활용

① 분석주제 1 : 실시간 업체 추천

- 분석 기법

- 분석 결과 활용 : 실시간 업체 추천 분석 모형 실행으로 산출되는 방문성향에 의한 추천 업체와 실

시간 밀집도 Top인 업체 정보를 참관객용 앱을 통해 다양한 정보를 확인할 수 있도록 결과를 제공

참관객간 유사도

즉정 Matrix 생성

방문 성향이 유사한참관객 찾기

방문 성향이 유사한참관객의 평균 체류시간 상대지수 산출

미방문 업체 중체류시간 상대지수가

높은 업체 추천

Page 89: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

89

한화 S&C 컨소시움

[그림] 실시간 업체 추천 분석 결과를 참관객용 앱에서 제공

② 분석주제 2 : 참관객 관심 센싱

- 분석 기법

- 분석 결과 활용 : 참관객 관심 센싱 모형 실행으로 산출되는 업체별 관심 지수 매트릭스 내의 위치

와 특징을 웹사이트를 통해서, 참가업체와 전시기획자가 확인하고 향후 전시회에 활용

방문성향에 따른 추천 실시간 TOP 추천

Page 90: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

90

③ 분석주제 3 : 참관객 동선 분석

- 분석 기법

- 분석 결과 활용 : 참관객 동선 분석 모형 실행으로 산출되는 주요 동선을 웹사이트를 통해서 전시기

획자가 확인하고 향후 전시회에 업체 배치에 활용

[그림] 사업 개념도

연결 수(Degree)전체 중 원의 크기가 가장 큼→ 총 연결 수가 가장 많은 업체

연결 강도(Weight)전체 중 연결선의 굵기가 가장 두꺼움→ 연결 강도가 가장 높은 업체 쌍은 {A, B}

1. 참관객 업체 방문 순서 분석2. 앞 - 뒤 방문 업체별(Pair)

빈도 분석

3. 주동선 파악을 위한

연결선 출력 빈도 범위 설정

Page 91: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

91

한화 S&C 컨소시움

주요 분석 결과 및 활용방안

1. 주요 분석 결과

• 서울국제사진영상프로기자재전(P&I Pro) 발생 데이터를 기준으로 분석 결과 도출

① 분석주제 1 : 실시간 업체 추천

- 참관객의 방문 유사도와 실시간 밀집도 Top10을 제거한 업체 중, 거리 순으로 최종 추천 업체를 참관

객용 앱을 통해 제공

[그림] 참관객 39번에게 제공되는 업체 추천 결과 예시

② 분석주제 2 : 바이어들이 관심을 가진 업체 및 아이템

Page 92: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

92

③ 분석주제 3 : 참관객 동선 분석

- 참관객들은 전시장의 오른쪽에 위

치한 업체를 더 많이 오래 방문하였

으며, 전시장 뒤쪽에는 다른 업체와

연결된 정도가 많아 이동의 중심이

되는 업체들이 분포해 있음

- 다음 전시회에 전체가 원활한 방문

이 일어날 수 있도록, 이동의 중심이

되는 업체들을 왼쪽 편으로 위치시

키는 방안 적용

2. 서비스 계획 및 활용방안

• 분석 체계 및 시스템 도입으로 분석 내재화된 전시 업무 진행

• 데이터 분석을 활용한 효과적인 참관객 정보 제공 및 참가 업체의 마케팅 적용

① 분석주제 1 : 실시간 업체 추천

• 전시산업 특성과 참관객의 방문 성향을 반영한 실시간 정보 제공

- 참관객은 방문 성향에 맞는 맞춤 정보를 실시간으로 획득할 수 있고, 효과적으로 업체 정보를 접근할

수 있음

- 쏠림이 심한 업체를 제외하고 방문이 많은 곳을 추천하므로, 유명도가 낮은 업체의 효과적인 노출로 인

하여 참관객 방문을 높일 수 있음

② 분석주제 2 : 참관객 관심 센싱

• 바이어와 일반참관객의 방문에 의한 관심 업체와 특징 파악

- 참가업체는 참관객의 관심을 파악하고 마케팅에 활용 가능

- 전시주최자는 참관객의 관심을 기반으로 다음 전시회 구성 제품 및 업체 확인 가능하며, 정보가 여러

회에 누적될 경우 해당 전시의 트랜드 파악 가능

③ 분석주제 3 : 참관객 동선 분석

• 참관객의 동선과 체류시간 분석을 통한 업체 영향도 파악

- 참가업체는 다음 참가시 위치 및 규모 선정에 활용

- 전시주최자는 방문이 낮은 위치 및 업체 파악으로 부스 배치를 개선하여, 전시장 쏠림현상을 해소하는

방안을 찾을 수 있음

Page 93: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

93

한화 S&C 컨소시움

기대효과 및 사업 활용 방안

[그림] 빅데이터 참조모델 적용으로 인한 기대효과

• 각 참여주체의 편의성 개선 및 전시회 참여 가치 향상

- 참관객은 빅데이터 분석과 위치기반서비스를 통해 전시회 입장등록부터 현장에서 다양한 편의성 서비

스 활용

- 참가업체와 전시주최사는 전시회 운영 성과를 정량적으로 확인하고 전시회 종료 후 데이터에 기반한

차기 전시회 기획 가능

• 국내 전시산업 확산으로 스마트化의 가치 선순환

- 개발된 빅데이터 참조모델과 Smart MICE 플랫폼을 타 전시장에 보급, 확산시켜 IoT 기술과 데이터 기반

전시 산업 패러다임을 전환

Lessons Learned

첨단 IT를 관객에 선보이는 화려한 전시회의 겉모습과는 달리 그간 전시회의 기획과 운영은 담당자

의 역량과 업계 관행에 의존하는 후진적인 구조로 운영되고 있었다. 그간 어떤 부스에 어느정도의

어떤 관객이 들러보았는지를 정확한 수치로 파악하기는 매우 어려웠는데, 이번 Smart MICE 플랫폼

을 통해 방문객의 특성을 처음으로 파악할 수 있게 되었다. 본 서비스를 통해 방문객의 프로필에 따

른 맞춤형 마케팅을 수행할 수 있게 되는 등 방문객과 전시업체의 소통을 도울 수 있게 되어 전시업

의 국제적 경쟁력 강화에도 기여할 수 있을 것이다.

Page 94: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 95: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

빅데이터 활용사례 - 국내

01·K쇼핑, 빅데이터 분석을 이용한 가구별 특화 상품 노출 시스템

02·더존비즈온, 빅데이터 기반 회계 관리 시스템

03·두산중공업, 발전소 고장예방 및 효율화 사례

04·신한카드, 고객맞춤형 타깃마케팅의 성장

05·11번가(SK플래닛), 스마트 추천 알고리즘 시스템 구축

06·올레TV(KT), 실시간 시청정보 – 타깃 콘텐츠 제공

Page 96: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

96

사업의 추진 배경 및 목적

1. 홈쇼핑의 시대는 가고 이제는 T-commerce

• 미래 홈쇼핑의 특징은 고객이 원하는 상품을 필요한 순간에 노출시켜 매출을 극대화 하는 방

향으로 전환할 것으로 전망

- 그동안 홈쇼핑 채널은 적지 않은 성장세를 보였으나 상품의 정보제공 및 구매 방식이 일방적인 형태였

기 때문에 고객별 성향에 따른 해당 제품 노출은 사실상 불가능

- 이에 따라 홈쇼핑의 다음 세대는 Smart-TV, IPTV, PC, 모바일 등 모든 디바이스와 연동되어 TV 시청

등 미디어의 소비가 이루어지는 과정에서 리모컨을 조작해 상품 구매 의사를 밝히면 즉시 주문과 결제

가 이뤄지는 T-commerce의 형태로 자연스럽게 이동할 전망

[그림] 미디어 시청 중 관련 상품의 소개와 구매 사례

01 고객이 생각하는 바로 그 상품!

K쇼핑BIGDATA국 내 사 례

[출처 : engage TV]

Page 97: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

97

효율성이 떨어지는 매스 마케팅이 아닌 개별 고객의 맞춤형 콘텐츠를 통한 매출

향상 효과 기대

K쇼핑

2. K쇼핑, ICT 융합의 노하우를 기반으로 T-commerce를 준비

• 모기업인 KTH의 기술력을 T-commerce에 접목하여 보다 혁신적인 서비스를 선보이기 위해

빅데이터 기반의 맞춤형 상품 노출을 기획

- K쇼핑은 기존 홈쇼핑이나 다른 T커머스 업체들과 다른 가장 큰 차별점을 만들어내기 위해 모기업인

KTH가 가진 애플리케이션(앱) 개발, 포털 운영 등 ICT 기술력을 T커머스에 접목해 더 편리하고 혁신적

인 서비스를 개발

- 특히 빅데이터를 통한 고객 행동 분석 데이터를 이용하여 고객별 최적화된 콘텐츠 및 상품 추천 알고

리즘을 개발하고 적용

추진 내용

1. ‘특정할 수 있는’ 고객의 취향과 관심은 어디로 가는가

• 수많은 고객의 관심과 취향을 정교하게 분석하여 상품 노출에 활용하는 기술 – 고객 매칭의

정확성과 정교함에서 승부가 날 것으로 판단

- 기존 홈쇼핑이 단 방향으로 소비자에게 상품을 권하고 상품에 대한 홍보 콘텐츠를 수동적으로 제공하

였다면 현재는 고객의 취향을 정확하게 분석하고 소비자가 필요한 화면 및 상품을 선택할 수 있게 고

객의 취향 및 행동 분석을 시작

- 특정 고객의 특정 관심도를 정교하게 매칭 하는 것은 구매 연결을 통한 매출 확대에 핵심이라는 판단

하에 데이터 수집과 분석 가공, 그리고 추천으로의 연결의 3단계 프레임워크를 구성

- 데이터는 IPTV 시청, 구매 이력데이터, Mobile 이용 데이터를 기반으로 광범위하게 수집하고 상품 특성

기반 분석과 고객 성향 기반 분석을 구분하여 TV와 모바일로의 연계를 추진

Page 98: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

98

[그림] T-commerce 기반 데이터 분석 Framework

• 고객을 세분화하고 그에 맞는 맞춤형 프로모션 제공 전략을 기획

- K쇼핑은 모바일 App을 제공하여 이용자의 이용로그 및 구매 상품 정보를 분석하는 것은 물론 구매하

지 않더라도 찜하기, 장바구니 정보, 검색 이력 등을 종합적으로 분석하여 고객을 3차원으로 정교하고

세부적으로 분류하는 방법을 설계

- 이를 토대로 고객 충성 행동에 따른 프로모션, 상위 고객 행동 패턴 연구, 이탈 고객 재유입 전략 개발

의 기초 자료로 활용 – 전체 매출 규모 지속 및 증가 유도

[그림] 콘텐츠 제공 및 상품 추천을 위한 데이터 수집 모델

[출처 : KTH, 2015]

[출처 : KTH, 2015]

TV APP 이용로그K쇼핑 APP 이용 로그

고객 충성도 유지를 위한프로모션 제공

A. 이탈 고객 구매금액, 빈도가 낮고 최근 구매가 발생하지 않은 고객

B. 수면 고객 구매금액, 빈도 높지만 최근 구매가 없는 고객

C. VVIP 구매금액, 구매빈도 높은 최근 구매 고객

상위 고객군 행동패턴을 유발시키는프로모션 제공

이탈한 고객을 재유입하기 위한프로모션 제공

구매상품구매상품정보

관심상품찜하기, 장바구니 정보

검색 이력 로그

1. 데이터 수집 2. 고객 세분화 3. 고객별 맞춤 프로모션

Page 99: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

99

K쇼핑

2. 데이터 분석의 경쟁력은 ‘대용량과 Real-time’ 처리 기술

• 실시간 분석 특화 솔루션 포지셔닝

- K쇼핑의 빅데이터 분석은 Real time 분석 기술을 기반으로 하고 있으며 CEP 아키텍처 기반으로 데이터

가 수집되는 즉시 실시간 처리, 실시간 패턴 분석을 통해 데이터를 분석하는 일괄 처리 방식을 이용

- 특히 구축 시스템의 핵심 경쟁력은 ‘선 분석 후 저장’이라는 개념으로 기존의 저장 후 분석에 들어가는

프로세스보다 크게 개선된 형태로 나타나며 1/1,000초 미만의 Computing 속도, 자체 HA 구현으로 고

가용성 확보, 실시간 분산 전처리, 연산을 위한 엔진 탑재, SQLike 문장(EPL)으로 실시간 계산을 위한

CEP Engine 탑재 등으로 설명될 수 있음

- 또한 다양한 Output Adapter로 결과 저장(DB,HDFS,FILE 등) 및 분석 결과 제공(Live Chart 등)과 이기종

데이터와의 융합을 통해, 새로운 분석 체계 및 지표 마련한다는 점이 장점

[그림] Real-time 분석 프로세스

• 개별 고객별 추천 시스템을 통해 상품에 대한 고객 관심 증가를 유도

- 개별 고객에게 빅데이터(상품 관계, 고객 성향 등) 분석 능력을 토대로 한 추천 시스템을 구축하고 상품

간 연관관계 분석 및 대체 / 보완 상품을 추천함으로써 고객의 관심 및 라이프 사이클에 맞는 구매 활

동을 지원

- 이러한 분석을 토대로 개별 고객에게 지역별 / 가구별 맞춤형은 물론 관심과 분석 결과를 토대로 한 차

별화된 콘텐츠를 전송하여 고객 구매 확률을 높이는 방향을 선택

[출처 : KTH, 2015]

Files / EventHTTP / TCP

InputAdapter

Data Grids

boltspout

EPL

OutputAdapter

Page 100: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

100

[그림] 고객 추천 프로세스 및 알고리즘 형태

• VOD나 실시간 방송 프로그램에 등장한 제품의 구매 연동

- VOD 시청 및 일반 TV 시청 화면에 노출되는 제품을 즉시 구매할 수 있도록 홈쇼핑 서비스 링크를 팝

업창 형태로 노출하고 통계 기반의 Custom 추천 알고리즘, 개인별 시청이력 기반 추천 알고리즘, 상품

구매 이력 기반 추천 알고리즘을 조합하고 분석하여 최적의 맞춤형 데이터를 도출

• 맞춤형 TV콘텐츠의 송출 – 고객의 구매 의욕 고취

- 상품 시청 정보 및 Demographic 정보를 통해 SAID별 가구 구성원 정보를 추론하는 알고리즘을 개발하

고 가입자 정보 분석 등의 3개~6개 특징으로 구분1)

- 분석된 가구 정보에 따라 SAID별로 맞춤형 채널을 전송하여 고객의 구매 의욕을 높이고 실제 구매 데

이터를 축적하여 보다 정교한 알고리즘으로 활용

[출처 : KTH, 2015]

1) 시청 가구 추론 및 시스템 설계는 KTH의 빅데이터 분석 솔루션인 ‘DAISY’를 이용

개인별

시청이력

추출

연관

사용자

분석

❶ Custom 추천

알고리즘(통계기반)

❷ 개인별 시청이력 기반

추천 알고리즘

❸ 상품 구매이력 기반

추천 알고리즘

개인별

추천상품

연관상품

가중치

부여

개인별

구매이력

추출

구매상품

연관도

분석

Raw Data

구축

Mata Data

적용

개인별시청이력그룹화

개인별연관상품sorting

개인별추천상품 Pool

사용자 로그

추천알고리즘

서비스 meta data

Page 101: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

101

K쇼핑

[그림] 가국 구성원 추론 알고리즘 개요 및 맞춤형 콘텐츠 송출 프로세스

- 축적된 데이터는 Machine Learning 기반으로 확장하여 고객의 채널 진입 시 개인별 맞춤 추천 상품을

자연스럽게 제공하는 형태로 활용하며 고객의 지역, 날씨 등의 조건에 따라 동적으로 변화하는 시청자

인터페이스를 제공

[그림] 시청자의 특징이 분석하여 반영된 상품의 화면 노출

[출처 : KTH, 2015]

장마시즌 50~60대에게선호도 높은 제습기 브랜드 3

연령과 구매이력 반영한주방과 생활용품 할인

실시간 인기상품

비 내리는 날 / 강릉에 위치한 / 2주일 전 주방용품을 구매한 고객

STB(SAID 2번)

STB(SAID 1번)

MOC

① Demographic 정보 및 상품 시청 기반 SAID별 가구 구성원 정보 추론 ③ 고객이 채널 20번 선택시

④ SAID에 맞는 Service ID를 송출

⑤ 고객반응 / 주문현황 분석 및 Seg 변경, 확대 요청

Daisy 기술 적용 영역

② 분석된 가구정보에 따라

SAID별로 맞춤형 채널전송

SAID Service ID 특성

1 720 독신가구

2 820 유아가구

시청가구 추론 가구별 채널 편성

프리미엄망프로파일링연동서버

A-DBS서버

독신가구

유아가구

초등가구

실버가구

Page 102: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

102

효과 및 향후 적용 확대 방안

1. ‘고객 맞춤형 T-commerce 적용 후, 매출 성장 두드러져

• T-commerce 시장에서 발군의 성장세

- K쇼핑은 2013년 227억 원, 2014년 680억 원을 달성했으며 2015년에도 두 배 이상 성장한 1,300억

원에 육박할 전망

- 거래액을 기준으로 커머스 사업은 2014년에 전년보다 200% 가량 성장했으며 2015년에는 2014년 보

다 90% 증가 - 경쟁 T커머스 업체들이 잇따라 시장에 진출하는 가운데서도 급속한 성장을 이뤄 더 의

미가 있는 것으로 평가됨

• 30~40대 연령층을 위한 데이터 분석 방안 추진

- 홈쇼핑을 보는 연령대는 현재 주로 50대 이상으로 나타나 홈쇼핑 타깃 고객들은 T커머스 기술 활용이

다소 낯설게 느껴질 수 있는 연령층이므로 이들이 T커머스의 편리성을 이해하도록 홍보를 강화하고 동

시에 30~40대 연령층을 공략하기 위해 모바일 커머스와의 연동을 늘리기 위한 방안을 계획

• 빅데이터 기반 T-commerce 기술을 통해 해외로 진출

- TV와 스마트폰, 인터넷 쇼핑이 하나로 통합되는 쇼핑 플랫폼 경쟁에서 최종 승자가 될 수 있는 키워드

를 ICT 기술과 해외진출로 잡고 올해 본격적인 사업 확장

- 빅데이터 기반의 T커머스를 통해 미국과 일본 진출을 준비 중이며, 동남아시아 일부 국가에서 방송사

과 양해각서를 체결하고 K쇼핑의 진출이 진행 중. 2016년에는 미국과 일본을 추가 진출 시장으로 확대

하며 몇몇 업체와 협력해 시장 진출을 위한 협의가 진행 중

Page 103: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 104: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

104

사업의 추진 배경 및 목적

1. 똑똑한 회계 업무를 위한 神의 한 수

• 회계 업무 환경의 변화

- 과거에는 거래내역 장부를 수기로 기록하고 전표 보관했으나 현재는 대부분의 기업 상거래 내역이 디

지털화 되어 막대한 데이터에 대한 효과적인 관리 방법이 필요해짐

- 자료 수집, 영수증의 일자별 정리, 입력 등의 작은 업무까지 손이 가는 절차에서 비롯되는 직원의 스트

레스 수준이 높은 편으로 나타남

• 기업회계처리 관련 빅데이터 생성 필요성

- 세무 회계 업무의 특성상 자료 수집, 전표입력 정리 등의 회계 외적인 업무에 시간이 오래 걸리는 문제

에 대한 대책이 시급

02 선박 신수요 예측플랫폼 및

MRO 서비스 모델 개발BIGDATA국 내 사 례

빅데이터 기반 자동 기장 회계 프로그램 ‘슈퍼북’

더존비즈온

스크래핑 이미지 인식

종이세금계산서

간이계산서

일반영수증세금계산서

PC

이미지 서버 이미지 자동인식

모바일 FAX

계산서 신용카드 현금영수증 통장

Page 105: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

105

빅데이터 기반 자동 기장 회계 프로그램 ‘슈퍼북’

더존비즈온

• 분개추천 고도화 필요성

- 초기 분개 추천 현황을 살펴보면 회사 패턴을 통한 추천 및 사용에서 매우 높은 성과를 보였으며 표준

패턴을 통한 추천의 고도화 필요

구분 회사패턴 추천출 전체 추천출 미추천출 사용률

전자세금계산서(매출) 94.4% 98.2% 1.8% 95.7%

전자세금계산서(매입) 92.2% 96.3% 3.7% 90.4%

신용카드(매출) 92.9% 해당 없음(기업별 모두 동일계정 사용) 89.5%

신용카드(매입) 32.4% 45.1% 54.9% 32%

현금영수증(매출) 90.6% 해당 없음(기업별 모두 동일계정 사용) 88.6%

현금영수증(매입) 34.7% 45.6% 54.4% 39.1%

통장(출금) 45.4% 45.4% 54.6% 37.4%

통장(입금) 49.3% 49.35% 50.7% 41.1%

추진 내용

1. 스마트한 회계 업무를 위한 빅데이터 기반 분석 작업 시작

• 기업의 모든 상거래 데이터 자동 수집 및 정형 데이터로 변환하고 분개

- 개별 회사의 거래 이력은 거래처별로 동일 거래가 반복적으로 발생하며 업종별 유사 회사도 동일 거래

처에 대한 거래 패턴 유사하여 데이터화하고 정형화하여 일관된 형태로 제공이 가능

회계와 관련된 모든 업무 처리를 신속, 정확, 편리하게

더존비즈온

[출처 : 더존비즈온, 2015]

Page 106: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

106

[그림] 슈퍼북 분개 추천 로직

- 표준 패턴 추천 고도화를 통한 연구를 수행하여 (1) 기계학습 모델을 통한 분개 추천 시스템 (2) 하이브

리드 추천 시스템 (3) 회계계정사용에 따른 업종 군집화로 구분

•기계학습방법론을 활용한 분개 추천 모형개발

- 1단계 Data Cleansing : 회사설정계정 삭제, 분개계정코드 수정, 출입금 구분에 따른 특이 계정은 삭제

- 2단계 자질추출 : 은행 전표 특수 단어 보정, 두 음절 분해(Bi-gram), 형태소 분석 활용 [자질 추천 : 음

절 Bi-gram 사용]

[그림] 두 음절 분해(Bi-gram) 예시

[출처 : 더존비즈온, 2015]

품명 or 거래처명 일치

형태소 분석 후가장 긴 단어

최근 거래일 기준 지수가중 평균값 적용

품명

- 세금계산서

- 계산서

거래처명

- 신용카드(매입)

- 현금영수증(매입)

( 사 | ) | 한 | 국 | 무 | 역 | 협

(사

사)

)한

한국

국무

무역

역협

1순위

1순위1순위

2순위

3순위

4순위

매입/매출 구분

차/대변구분

사업자 번호

품명

거래처명

업종

1. 사업자 번호

2. 품명 or 거래처명

1위 확률을 추천한다.

단, 확률이 50% 미만인 경우에는 미추천하고 과거 사용한 계정들을 3개까지 보여준다.

1순위 중

① 높은 확률 추천

② 확률이 같으면 사업자번호

로 추출한 계정 추천

1. 신용카드(매출)

2. 현금영수증(매출)

3. 통장 제외

SUPER BOOK상/하단 전표

계정생성

회사패턴(사업자번호)

회사패턴(품명 or 거래처명)

업종 표준 패턴

전체 표준 패턴

계정 1(1위 확률)

계정 2(2위 확률)

계정 3(3위 확률)

Page 107: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

107

더존비즈온

[그림] 형태소 분석 활용

- 3단계 기계학습모형개발 : 모형 개발 셋 & 검증 셋 구성, 자질 기반 모형 개발

- 4단계 적용 : 적용모형 및 기준 값 설정으로 최종 모형 선택, 추천 기준 값 선택, 슈퍼북 추천 모듈 개발

SVM 모형 : 지도 학습에 사용되는 기계

학습 알고리즘 중에 하나로 주어진 자료

에 그 자료들을 분리하는 초평면 중에서

자료들과 가장 거리가 먼 초평면을 찾는

방법으로 분류 문제에서 가장 좋은 성능

ME 모형 : SVM과 유사하게 지도 학습

에 사용되는 기계학습 알고리즘 중 하나

로 성능은 SVM에 비해 유사하거나 약간

낮으나, 특정 계정 코드가 1등으로 추천

될 확률 값을 구할 때 적용하기 좋음

내부 환경의 변화

내부 환경의 변화

내부 환경의 변화

내부 환경의 변화

내부 환경의 변화

내부 환경의 변화

내부 환경의 변화 내부 환경의 변화

내부 환경의 변화 내부 환경의 변화

내부 환경의 변화

내부 환경의 변화

자질 추출

계정 추천

•denotes+1

•denotes-1

Support Vectors

분석성공

분석성공

표준 패턴 DB

기계학습 모델(SVM, ME…)

Page 108: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

108

• Hybrid 추천시스템

- 추천 계정 중 미사용 계정 분석 결과 경비성 계정의 추천 항목 미사용률이 높았음. 원인 분석 결과 경

비성계정 중 업종별로 구분되는 원가계정(제조, 도금, 분양 및 판관)들의 코드차이로 미사용하는 것을

알 수 있었으며 빅데이터 분석을 통해 기업은 증빙 별로 항상 일정한 원가계정을 사용하는 것을 파악

[Hybrid 추천 시스템]

• 회계계정 사용에 따른 업종 군집화

- 1단계 Data Cleaning : 회사설정계정과 전표개수가 적은 업종은 데이터에서 삭제

- 2단계 업종별 계정 사용률 평균 : 개별 업종에 대해서 매출 차변, 매출대변, 매입차변, 매입대변 각각

계정평균 사용률 도출

- 3단계 군집화 (군집분석 수행)

[회계 계정 사용에 따른 업종 군집화 – 군집 분석]

- 4단계 적용 검토 : 계층군집분석과 MDS 분석을 수행하여 20여 개의 군집으로 조정한 뒤 세무사 및 회

계사 등의 전문가 집단과 협의하여 최종군집조정

[출처 : 더존비즈온, 2015]

회사 패턴

기업 표준 패턴

최종 분개 추천

회사 패턴

1. 추천 안됨2. 통합코드 추천

3. 통합코드를 계정코드로 변환

K-Means Clustering

•베타적(Exclusive) 군집분석 방법

•비계층적 군집분석(Non-hierarchical Clustering)

• 유클리디안거리(Exclusive Distance)를 유사성의 척도로 사용

•수행방법

STEP1 : 임의의 군집중심점 할당

STEP2 : 모든 객체에 대하여 각 군집중심점과의 유클리디안

거리를 측정하여 가장 가까운 군집에 할당

STEP3 : 할당된 군집을 대상으로 새로운 군집중심점 할당

(군집평균)

STEP4 : STEP2와 STEP3을 반복

STEP5 : 더 이상 군집간 이동이 없는 경우 STOP

Page 109: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

109

더존비즈온

[출처 : 더존비즈온, 2015]

효과 및 향후 적용 확대 방안

1. 회계 업무의 새로운 시대 개막

• 기업의 모든 상거래 데이터(전표) 자동 수집 및 정형데이터로 변환

- 분개 추천 : 기업의 거래 패턴 이용 기업 표준 거래 패턴 이용 수집된 전표의 자동 분개(추천)

- 수임처에 직접 방문하여 클라우드 방식의 장점을 설명하고 슈퍼북 실행 화면을 직접 시연하거나 편리

한 진행상황 파악의 장점을 부각하여 고객 신뢰감 상승

- 자료 수집에 많은 시간을 투자하지 않아도 되며, 매입카드를 자동으로 불러와 분개 단계까지 완료되어

정리시간 단축 효과가 나타나기 시작

•회계처리에 필요한 데이터 자동 수집

- 자동학습방법에 의해 완전 자동화된 빅데이터 분석으로 정확도 향상

- 자료 수집과 입력 시간이 크게 단축되어 신고 마감에 필요한 시간 절약

•실제 사용고객의 빅데이터 기반 추천 시스템 효과로 사용률이 전반적으로 상승

[그림] 슈퍼북 사용률

- 슈퍼북의 빅데이터 기반 추천 시스템 효과로 현재 사용 고객 수는 기업고객 대비 약 10%, 세무사무소

고객 대비 약 8% 증가

슈퍼북 사용률

출전자세금계산서

입전자세금계산서

매출신용카드

매입신용카드

현금영수증매출

현금영수증매입

통장출금

통장입금

사용전 1차 2차

Page 110: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

110

• 빅데이터를 활용한 미래 가치 비즈니스 개발

- 다양한 정보 제공업체의 데이터 수집(국세청홈택스, 여신금융협회, 13개 카드 / 20개 은행사)

- 데이터마이닝을 분석에 도입하여 비정형데이터 처리, 자연어 처리(형태소 분석, 텍스트마이닝), 이미지

처리 및 AI(인공지능, 기계학습 방법론 적용) 가능

- MongoDB를 활용하여 기업표준데이터를 저장해 은행거래 등의 텍스트 데이터 활용에 유리

- 클라우드 환경에서의 빅데이터 활용 솔루션 제공과 프로그램이 유지보수, 보안관리에 유리할 것으로

예상

Page 111: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 112: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

112

사업의 추진 배경 및 목적

1. 돌발적인 발전소 고장 원인 파악 – 빠르게 파악하려면?

• 발빠른 고장 원인 분석은 발전소 개선 영역의 ‘핵심 요소’

- 발전소의 고장 및 정지가 비계획적인데다 지속적으로 발생하고, 기존 인력만으로 관리가 지속되기에는

한계가 발생하여 보다 효율적인 관리가 필요

- 발전소 고장 및 정지의 주요 원인은 보수 불량과 설비 결함으로 밝혀지고 있으며, 전체 고장에 94%를

차지. 또한 발전소 고장 정지는 위험 알람 후 90% 이내에 발생한다는 것을 발견

[그림] 돌발 고장 사례

03 발전소 고장 예방 및 구동 시간 단축

두산중공업BIGDATA국 내 사 례

[자료 : 두산중공업, 2015]

터빈 베어링 Journal 손상

[발전장치 42일, 피해금액 : 미확인]

보일러 층수 과다로 터빈 물 유입

[발전장치 90일, 피해금액 : 18억 원]

차단기 부동작으로 발전기 회전자 손상

[발전장치 19일, 피해금액 : 미확인]

Trip 사고의 90%는

알람 후

10분 이내 발행

FD FAN 진동으로 파손

[발전장치 34일, 피해금액 : 3.5억 원]

고정자 권선 냉각수 막힘으로 절연파괴

[발전장치 44일, 피해금액 : 5억 원]

Page 113: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

113

[그림] 발전소 주요 고장 인자

- 원격 모니터링 서비스 (Remote Monitoring Service)는 정보통신기술(ICT)을 활용하여 발전플랜트의 운전정

보를 시간, 공간의 제약 없이 실시간으로 모니터링/진단하고 고객을 지원하는 서비스로 ICT 기반 구축 및

핵심 역량 확보를 위한 ICT Ready 과제를 도출하여 발전소 주기기 제품의 경쟁력 제고와 고객 서비스 강

화를 위한 기반 수립

원격 모니터링 서비스 시행에 따른 발전소 고장·예방과 발전기 구동 시간 단축

을 위한 최적화 서비스

두산중공업

[자료 : 두산중공업, 2015]

[전력거래소, 연도별 전력설비 정지통계(2011~2014)]

지속 발행, 관리의 합계

가스

주요 고장 인자 <500MW 석탄화력 2기 기준>

석탄 수력유류

( )은 민간 발전사의 고장건수임

민간 분야는

가스터빈에 집중됨

‘11년

‘12년

‘13년

‘14년

182(119)

19 15

5 7 96 63

31(23)

17(8) 12

(8)10(6)

12(4)

2923

17

157(89)

(74)124

(58)71

원자력

Page 114: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

114

[그림] 두산중공업의 RMS 추진 배경

추진 내용

1. 사고·고장 예방 – 빅데이터가 해결하다

• RMS 센터를 운영하여 상시 지원 및 관리 체계화

- 발전소의 Issue 사항 접수 및 모니터링을 통해 진단, 예측, 경보를 통한 솔루션 관리하는 1차 분석으로

실시간 data 관리

- RMS센터에서 분석한 1차 분석을 바탕으로 서비스 전문가와 주기기 전문가가 발전소 운전 정보를 확

인하여 방대한 양의 빅데이터 분석을 통하여 기술적인 문제 처리는 물론 부품교체, 심각한 문제에 대한

원인 분석 및 방안을 도출

[자료 : 두산중공업, 2015]

• 중공업 ICT 융합 기술 활용

을 통한 신 사업 추진 중

• PJT 수행 경험과 기술을 활

용하여 중공업 Biz 경쟁력

향상 지원

• OEM 회사로써 빅데이터를

통해 전력 시장 수익성 극대

화 및 기술 지원

• 기존 제품 경쟁력 강화

- 빅데이터 활용을 통한 핵심

기술 개발

• 고객 서비스 제공

- 예측/예방/고장 진단 서비

스를 통한 발전소 이용률 및

수익성 극대화

• 신규 Offering 확대

- 특히 최적화 Solution 제공

• 기자재(H/W) 중심에서 S/W

분야까지 확장을 통한 경쟁

력 강화

- 제품 및 수주 경쟁력 향상

- 설계/시운전/품질 경쟁력

향상

• 신규 사업기회 창출 참여

*TPP : Thermal Power Plant(화력 발전소)

**CCPP : Combined Cycle Power Plant(복합화력)

• 양주/하남/당진 TPP*/영월 프로젝트(CCPP**)의

RMS 고객 서비스 제공

• RMS 구축 자체 S/W 기술력 확보 / 빅데이터 기

반 주기기 모델 표준화

• 운전 데이터 집계 및 분석 서비스 제공(시운전/

Warranty 데이터)

• Plant/주기기 특화된 Embedded S/W 개발 제공

• 시스템

- 예측/예방/고장 진단 Solution

- 실시간 DB 관리 및 운영 기술

- 제품별 발전 빅데이터 분석

기술

- S/W Center Embedded

설계/개발

Background 고객 Value Creation

Opportunity

Action Item

Opportunity

Technology 요소

❶ PJT 운전 Data 확보 Value Add / Creation

❷ Data 기반 설계 검증

및 제품 개선

❸ 서비스 사업 강화 위한

RMS 확대 및 가속화

❹ 핵심 Application

내제화

❺ 운전/제어로직 설계

표준화

❻ 플랜트 운전 시뮬레

이터 구축

❼ S/W 센터 구축 및 역량 확보

Page 115: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

115

[그림 4] 두산중공업의 RMS 운영 프로세스

• 프로세스의 역할

• 발전 Plant 건설과 운영의 가치 극대화를 위한 선순환 구조의 촉매 역할

- 기존에 운영되던 정비 – 운전 - 조정의 과정과 설계 – 제조 - 설치의 과정이 분리되어 있던 프로세

스를 RMS 센터 운영을 위해 통합

- RMS 센터 구축에 따른 프로세스별 정보 전달 속도 향상은 물론 프로세스별 준비 시간 단축으로 정보

공유 및 상호 지원 강화

[그림] 두산중공업의 RMS 이용 개선 사이클 완성

두산중공업

[자료 : 두산중공업, 2015]

[자료 : 두산중공업, 2015]

*PDM : Pre-Diagnosis Memo(예측진단 메모)

**주기기 전문가 : Boiler, Gas Turbine, Steam Turbine, Generator, BOP 등, 주기기 품목별 설계/기술 전문가

실시간 운전현황 진단

Issue 사항 접수 및상태 모니터링

Hot Line(경보/조치)

요청 / 접수서비스 전문가

주기기 전문가**빅데이터

(발전소운전정보)

통보

이상징후 조기 예측/경보

고객 맞춤형 솔루션 관리

설계

정비

설계설계

제조

제작

설치

설치

운전

운전

조정

조정

정보공유상호지원

두산 중공업RMS 센터

발전소 RMS 센터

1차 분석

2차 분석

Page 116: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

116

2. 수익 증가는 물론 효율성의 상승효과를 ‘경험’

• RMS 시스템 구축에 따른 고장 원인 case별 성과 사례 발생에 따른 효율성 증대와 비용 절감

효과 발생

- 실시간 모니터링을 통한 이상 징후 조기 경보 서비스가 가능해지고, 아날로그 신호의 트랜드를 정상상

태와 비교하여 이상 유무를 진단할 수 있는 시스템이 구축

- 과거의 운전 트랜드와 비교하여 사고 발생 사전 차단 효과가 나타남

[그림] RMS 활용 사례

• 운전 중 인지를 못하고 있던 정보 사전에 제공하여 대형사고 예방

- 조기 경보 시스템을 통해 비정상상태에서 운전되고 있는지 판단하여 발전사에 통보 후 관련 결과 확인

후 정지 후 발전소 운전이 가능한 상태에서 진단 가능

- 비정상적인 운전요인을 사전에 예방가능하며 2차사고 예방도 가능해졌으며 고장·정지 및 기회비용

손실을 사전에 예방할 수 있는 시스템이 구축됨

- 이상 데이터 확인 및 비정상 상태 사전 분석 및 분석 시행을 통한 데이터 확보가 가능해졌으며 고객사

현장 점검을 통한 위험 확인 후 발생 가능한 문제점 제시 및 해결방안 제시를 통한 위험요소 해소 프로

세스를 보유

Page 117: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

117

[그림] 고장·정지 case별 성과 사례

효과 및 향후 적용 확대 방안

• 발전소 운전 정보를 활용한 데이터 분석을 통한 모델 개발에 따른 발전소 Startup 시간 최적화

- Turbine CV Chest Warming 시간 단축에 필요한 발전소 운전 정보와 관련된 영향 요소 분석하고 발전

소 Startup 시간 단축 가능한 온도변화율 통계적(선형) 모델을 개발

- 발전소 Startup 1시간 지연에 따른 기회 손실 비용 3.73억 원 절감과 0.5시간 단축에 따른 1.86억 원 수

익으로 연간 총 5.59억 원의 수익 증대

[그림] 발전소 Startup 시간 단축

두산중공업

[자료 : 두산중공업, 2015]

[자료 : 두산중공업, 2015]

[CASE 1] [CASE 2] [CASE 3]

Page 118: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

118

• 시스템 구축으로 인한 유지 보수비용 감소, 발전운영 기술 지원, 수익성 확대를 통한 효율성과

비용적 측면의 효과가 발생

- 계획 예방 정비 체계에서 설비상태에 따른 예지 정비 체계로 전화되어 설비 수명주기 동안 자산의 관

리 최적화 가능

- 실시간 모니터링 분석으로 비정상 상태의 조기 발견 및 사전 조치로 운전 신뢰성 향상 및 축적된 데이

터 활용을 통한 체계적이고 지속적인 지원 가능

- 설비 가용성, 성능 안정화 향상으로 미출 증대 및 수익 향상 및 돌발 고장 및 정지 기간 감소로 인한 가

용 능력 향상에 따른 수익 증대 효과

- 향후 문제 개선 및 고객의 니즈 반영을 위한 원인 분석과 제품 개선에 이르는 종합 서비스 구현

Page 119: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 120: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

120

사업의 추진 배경 및 목적

1. 빅데이터 분석 및 활용 : 지속적 강화가 핵심 목적

• 카드 비즈니스의 본원적인 경쟁력 강화와 고객만족경영을 위해 공익성을 담은 빅데이터 기반

사업의 강화

- Code별 전자제품 매칭 및 이용패턴 분석으로 최적화된 맞춤형 마케팅 전략 수립과 효과 제고

- 카드 사용 고객의 관점에서 생각하는 소비 생활 서비스 및 상품 제공으로 매출 증가 기대

- 특정 고객을 타깃으로 설정하는 마케팅 보다 현재 보유하고 있는 고객의 성향을 빅데 이터 분석하

여 영업 전략 도출

• 인터넷과 소셜미디어에서 회사의 이미지, 활동에 대한 긍정 혹은 부정 등의 고객 감성 분석을

실시해 마케팅과 기업 평판 관리에 활용

- 고객의 다양한 요구와 최신의 니즈를 명확하게 반영하여 상품에 반영

- 브랜드 가치 및 고객만족도 제고, 사업 포트폴리오 강화, 차별화된 금융상품 및 서비스 제공

추진 내용

1. 고객의 움직임, 그리고 패턴, 트랜드를 읽어내는 기술

• 기존의 CRM이 고객의 과거 이력을 분석하여 고객과 상품분류를 기준으로 취급액과 수익성 등

양적 목표를 위해 개발되었던 점을 개선

- 고객의 다양한 요구와 최신의 요구를 명확하게 파악하고, 상품에 반영

04 빅데이터 기반 고객 맞춤형 타깃마케팅

신한카드BIGDATA국 내 사 례

Page 121: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

121

- 비정형 정보 분석 시스템 구축 및 활성화를 통한 비즈니스 성과창출 기반 마련하고 - 비정형 데이터를

정형화하여 분석모델에 적용해 이탈 고객을 미리 예측

- 상담원 메모 텍스트 분석을 통하여 메모 입력 강화 및 인원 유형별 사전 대응 체계 수립

• 마케팅 전략 수립을 지원하는 데이터 및 컨설팅 분석방법론 마련

- 카드 결제 내역을 분석해서 기존 고객의 이용 특성을 분석하여 현 상황 파악 및 향 후 고객 유치 과

정에서 알맞은 카드 서비스를 제공할 수 있는 전략 수립

[그림] 카드 사용 고객의 기본 인적 데이터와 이용 비율

- 업종별 지역 경쟁 상황 분석으로 강/약세에 따라 마케팅 전략 수립 및 경쟁사 대비 포지셔닝(예를 들면,

최근 꾸준히 수가 증가하고 있는 나홀로 SOLO(1인 가족)는 자신을 위한 투자와 여가를 위한 지출 모습

을 나타내는 소비 성향을 보임

고객의 소비 패턴을 파악해 실제로 유용하게 사용할 수 있는 카드 서비스와 혜택

제공으로 결제액 증가 도모

신한카드

[출처 : 신한카드, 2015]

Page 122: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

122

[그림] 소비 트랜드 분석

[그림] 섹터 최적화를 위한 카드 사용처 분석

- 왼쪽의 예시는 특정 지역의 업종을 음식, 관광 /

레저, 편의점 / 쇼핑으로 구분하여 소비자가 결

제한 상점에 대해 분석한 것으로 고객의 소비 성

향과 카드 사용 집중 지역을 다룬 정리된 데이터

확보 가능

- 가맹점에서 파악하기 어려운 고객의 주 소비지역

거리 데이터 확보를 통해 정확도나 이용도가 높

은 타깃 발굴

[출처 : 한국경제]

[출처 : 신한카드, 2015]

Page 123: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

123

[그림] 주요 업종별 가맹점-이용고객 간 평균거리

- 2천 2백만 고객의 소비패턴 빅데이터 분석을 통한 남2)/녀3) 각각 9개의 인사이트 모델을 확보하고, 소

비자의 성향에 따라 총 18개 군으로 분류하여 소비 유도

- 최대 262,152가지에 달하는 경우의 수를 도출하여 고객의 잠재적 요구 파악

- 중, 장기 소비패턴(Macro Trend)분석 및 최신 트랜드(Micro Trend) 분석 병행

[출처 : 신한카드, 2015]

2) 남성코드 : 루키(사회초년생), 프렌드 대디(체험활동 많은 아빠), 로엘(패셔니스트), 스마트 세이버(합리적 소비 추구), 미

스터 루티니(일반 직장인), 보보스(일과 여유를 즐기며 독특한 소비), 브라보 라이프(사회적 기여를 하고 젊은 감각을 지

닌 중장년), 리얼리스트(웰빙에 관심 있는 중장년), 그레이 젠틀맨(합리적 소비와 삶의 질을 중시하는 장노년층)

3) 여성코드 : 잇걸(활발한 소비와 대외활동), 프리마돈나(문화와 여가를 즐기는 싱글 직장인), 트랜드 세터(럭셔리한 삶을

즐기는 세련된 여성), 루비(자기계발에 적극적인 젊은 감각의 여성), 퀸 오브 하우스(투철한 경제관과 가족을 보살피는

여성), 알파맘(자녀교육에 매진하는 엄마), 줌마렐라(자신을 꾸미고 여가에 투자하는 여성), 그레이스 우먼(레저, 여가, 기

부에 적극적인 여성), 실버 레이디(건강하고 삶 자체를 즐기는 시니어 여성)

신한카드

고객주소(자택/직장) 기준 고객 主 소비지역 기준

가맹점 가맹점

Page 124: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

124

효과 및 향후 적용 확대 방안

1. 빅데이터 활용과 카드 사용 트랜드의 리더로 성장

• 2015년 상반기 체크카드 총 이용액 11조 3천억 원으로 집계

- 전년 동기(9조 1천억 원)에 비해 2조 2천억 원(24.3%) 증가한 수치로 일시불 이용 증가액(2조 6천억 원)

중 체크카드 이용액이 대부분을 차지

- K카드사 1조 7천 9백억 원(17.1%), W카드사 3천 6백 4십억 원(4.7%) 증가와 비교하여 주목할 만한 결

과 달성

• 카드업계 리딩 컴퍼니로서 카드업 맞춤 빅데이터 비즈니스 지속 발굴 및 비전 제시

- 빅데이터 에코 시스템 구축으로 인사이트 제공

- CLO(Card-Linked offer) 서비스를 최적화하여 맞춤형 혜택 업그레이드 및 구매 적중률 상승 도전

- 빅데이터 기반 고객만족경영 개선을 통해 고객의 잠재적 니즈 파악과 맞춤형 솔루션 제공으로 고객 행

복 지향

- 스마트워치 등의 웨어러블기기에 빅데이터 기반의 서비스 적용

• 과거의 소비패턴이 아닌 미래의 소비패턴을 예측하고, 고객 스스로가 인지하지 못했던 잠재적

인 소비 욕구에 맞춘 새로운 상품체계 탄생

- 현재 뿐만 아니라 미래에 이목을 집중시킬 트랜드나 관심 분야를 예측하여 선제 대응할 수 있는 배경

으로 데이터 가공

[그림] Data Mash-Up

[출처 : 신한카드, 2015]

분석 대상 지역 선정 [2014년] 격자단위 Data 단순 융합 [2015년] Data 분포도에 따른 재 블럭화

Page 125: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

125

• 타 업종 간의 단순한 데이터 융합을 넘어 인사이트를 도출할 수 있는 단위의 재분류나 활용 범

위 확장 등으로 지속 발전 계획

- 빅데이터 역량을 바탕으로 공공기관의 합리적 의사결정을 지원하는 영역으로의 확장 고려

- 사회적 약자를 위한 복지정책, 골목상권 활성화 등의 현안 해결을 위한 빅데이터 제공

신한카드

Page 126: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

126

사업의 추진 배경 및 목적

1. 커머스 시장, Offline에서 Online-Mobile로 전환 ‘가속화’

• 소비의 수단이 오프라인에서 온라인으로, 또한, 스마트폰, 태블릿PC로 빠르게 이동

- ICT 기술의 발달은 쇼핑의 공간과 시간적 제약을 없애며 기존 오프라인 중심의 커머스 시장을 온라인/

모바일 중심으로 전환

- 기존 의류, 전자제품, 컴퓨터 주변기기 중심의 시장은 티켓·여행, 생활용품 등 다양한 제품이 거래되

면서 거래규모가 증가하는 추세

- 또한, 소셜커머스와 같은 새로운 비즈니스가 등장하면서 리테일 산업 전반에 새로운 변화를 가져옴

[그림] 리테일 산업의 변화

05 빅데이터를 통한 서비스 진화

11번가(SK플래닛)BIGDATA국 내 사 례

[출처 : BCG]

Page 127: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

127

2. 치열해진 경쟁 + 똑똑해진 소비자 : 새로운 무기를 찾아라!

• 기업 및 판매 채널 간 심화되는 경쟁

- 오프라인 매장 등 싱글 채널에서 이뤄지던 소비는 온라인/모바일 등 다양한 판매 채널로 확장되고 기

존 오프라인 사업자들은 소비자와 접점을 늘리기 위해 온라인과 모바일 쇼핑 채널 개설 확산

- 또한, 백화점, 슈퍼마켓, 대형쇼핑몰 등 전통적인 소매 전문 기업뿐만 아니라 제조사, 유통사 심지어 소

비자들도 리테일 산업의 플레이어로 참여하면서 사업자간 경쟁 심화

- 기업 간 경쟁은 물론 같은 브랜드에서 운영하는 채널 간 경쟁으로 인한 자기시장 잠식 현상도 발생하

는 등 리테일 기업의 수익성 악화

• 스마트 컨슈머(Smart Consumer)의 등장

- 온라인·모바일 등의 판매채널을 통해 다양한 제품 정보 검색이 가능해지면서 소비자들의 소비 방식

은 더욱 Smart하게 변화했고, 모바일 기기를 통해 시간 및 장소의 제약 없이 실시간 최저가 쇼핑몰과

상품에 대한 평가를 검색, 소비자간 정보 공유, 쇼핑이 가능

빅데이터 기반 구매 상품 추천 시스템을 통해 매출 증가는 물론 고객만족도 향상

및 구매 전환율 증가 효과가 나타나

11번가(SK플래닛)

스마트 컨슈머 소비 행태 변화

스마트폰, SNS 등 기술의 발전장기적 구매 계획하에 가장 저렴한 시점에 구매

주요동인 소비방식의 변화

IT 수준 향상, 글로벌 물류시스템 효율화 해외 쇼핑몰에서 직접 구매

포인트 및 마일리지제 활성화포인트, 마일리지를 복합적으로 활용한 구매

시간적 변화

공간적 변화

수단적 변화

Page 128: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

128

• 치열한 경쟁 환경, 차별화된 서비스 제공 필요

- 리테일 산업은 경쟁 심화로 제품 간 품질 차이가 줄어들면서 제품 차별화에서 판매 방식 차별화로 패

러다임이 바뀌고 있음

- 서비스를 통해 고객 행동을 이해하고 고객이 요구하는 쇼핑 경험 가치에 대한 통찰의 획득이 고객 서

비스의 주요 자원으로 부상

• 새로운 대안으로 부각되는 추천서비스

- 미국의 온라인 쇼핑몰 아마존 닷컴은 고객이 구입한 상품 정보를 분석해 구매 예상 상품을 추천하고,

개인화된 쿠폰을 제공하여 회사 매출의 약 30%가 빅데이터 기반 추천 시스템을 통해 발생

- 추천시스템은 사용자의 관심에 맞는 제품 또는 서비스를 제공하여 사용자의 탐색 노력을 줄이고 사용

자 만족도를 증진

- 또한, 사용자의 선호도와 구매 이력을 중심으로 추천을 제공, 사용자가 다양한 대안들 중에서 의사결정

을 할 수 있도록 도움을 제공하여 판매를 촉진

[그림] 쇼핑몰 vs. 추천서비스를 적용한 쇼핑몰

[출처 : SK플래닛(RecoPick)]

방문 방문나가기 나가기

구매 가능성이 높은

상품추천

상품구경 상품구경

Page 129: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

129

추진 내용

1. 빅데이터에서 새로운 돌파구를 찾다

• 데이터 분석을 통한 차별화된 고객 서비스 가능

- 빅데이터 기반 실시간 추천서비스는 정교화 된 추천서비스가 가능해 사용자의 만족도 및 매출향상에

큰 도움이 될 것으로 전망되며 정교화된 추천 서비스는 소비자들의 니즈를 충족시켜 구매 전환율4)을

증가시키고, 잠재고객의 소비를 촉진

• 보다 정확한 빅데이터 기반 추천서비스 필요

- 국내에서도 상당수의 온라인 쇼핑몰 등은 자동추천시스템을 갖추고 있으나 대부분이 소비자의 구매

정보를 통해 관련 제품을 지속적으로 추천하는 방식으로 정확도 문제가 발생(결혼도 안한 소비자가 주

변 친구나 친척 선물을 위해 기저귀를 샀다고 그 이후로 계속 아이 관련 제품들을 추천하는 방식)

- 이 같은 문제를 극복하기 위해서는 단순히 데이터베이스에서 패턴을 매칭하는 방식에서 벗어나 새로

운 분석 데이터와 알고리즘이 필요

[그림] 빅데이터 Intelligent Recommendation System

[출처 : ITRI]

4) 구매전환율 : 웹 사이트 접속자가 가입이나 구매 등 웹사이트가 의도하는 행위를 취하는 비율

11번가(SK플래닛)

Front-End API Servers Analytic Cluster

Page 130: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

130

• 사용자의 최근 로그를 실시간으로 분석해 관심사에 기반을 둔 맞춤형 추천 기능을 제공

- 대용량 데이터 처리를 도와주는 오픈소스 하둡과 하이브, 하둡 맵리듀스에서 실행되는 머신 러닝 라이

브러리, 아마존웹서비스 클라우드 서버를 이용해 추천 알고리즘을 개발

- 최근 3개월 간 개인의 과거사용 이력을 분석해 사용자의 행동, 체류시간, 물품의 구매 여부, 추천 리스

트 클릭 여부 등을 종합적으로 판단해 상품 간 추천 목록을 제공

- 또한, 별도의 인프라 투자나 개발 인력 투입 없이 간단한 스크립트를 추가하는 것만으로 서비스 이용이

가능한 SaaS 방식의 빅데이터 추천 서비스인 것이 특징, 트래픽 증가로 병목이 일어날 수 있는 구간은

모두 Auto scaling을 적용하여 최적화

[그림] RecoPick 시스템 구조도

[출처 : SK플래닛(RecoPick)]

[출처 : SK플래닛(RecoPick)]

5) Auto Scaling : 사용자가 정의한 정책, 일정 및 상태 확인에 따라 자동으로 Amazon EC2 인스턴스를 시작하거나 종료하

도록 설계된 웹 서비스

RecoPick 데이터 수집 Process

Collector

Storage

Database(HBase) Hadoop Cluster

API

사용자들이사이트를 방문하면,

스크립트 삽입 로그 데이터가전송합니다.

간단한 스크립트 삽입 만으로모든 데이터 수집 과정이 끝남

Page 131: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

131

효과 및 향후 적용 확대 방안

1. 11번가, 고객만족도의 향상 및 매출의 증가 ‘확인’

• 11번가(SK플래닛), 빅데이터 기반 추천서비스 적용으로 고객 만족과 매출 향상 등 두 마리 토

끼를 동시에 잡아

- 새로운 추천서비스를 적용한 결과 모바일 분야에서는 사용자의 상품 PV(Page View)가 추천서비스 적

용 전보다 5.6% 증가하였으며, 전체 매출은 2.9%가 증가

- 온라인 쇼핑에서는 Page View는 9% 증가한 것으로 나타남

[그림] 모바일 11번가 추천서비스 적용 테스트 결과

[그림] 추천시스템 적용후 상품뷰 결과

• 11번가, 빅데이터를 통해 보다 향상되고 차별화된 서비스 주력 계획

- 11번가와 SK플래닛은 글로벌 커머스 사업자로 도약, 국내 오픈마켓은 물론 오프라인 시장까지도 아우

르는 빅데이터 사업자를 목표로 하여 O2O 서비스 결합에 주력

[출처 : SK플래닛(RecoPick)]

[출처 : SK플래닛(RecoPick)]

11번가(SK플래닛)

인당 상품뷰

추천 노출없음

추천 적용 전 RecoPick 추천 적용 후

추천 노출없음

추천 노출있음

추천 노출있음

그룹별 전체 매출

Page 132: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

132

사업의 추진 배경 및 목적

1. 당신이 찾던 즐거움이 바로 여기에

• 콘텐츠 종류가 다양화, 세분화 되면서 취향에 맞는 콘텐츠 검색이 점점 어려워지거나 소요 시

간이 많이 필요하게 되는 불편함

- 다양한 콘텐츠와 채널이 발전하면서 선택 범위가 매우 넓어졌으나 이는 오히려 수요가 분산되는 현상

발생

- 수요보다 공급이 훨씬 많은 환경에서 빅데이터로 얻게 되는 데이터와 발견을 통해서 콘텐츠 구성 전략

및 적용이 중요

• 대용량 데이터에 실시간으로 대응해 정보를 수집·저장·분석하고 이를 바탕으로 사용자에게

콘텐츠나 상품 추천

- 개인의 취향과 성향에 맞춤화된 콘텐츠를 제공하거나 기획/개발하는 추세

- 매출 증대를 위한 직접적인 수단으로 접근하는 것 보다 시청자에게 제품을 인식시켜 자연스럽게 다음

단계에 연결되는 방법으로써 활용 가능성 대두

추진 내용

1. 사용자의 행동 – 무엇을 원하는지 정확히 알 수 있어

• Realtime 빅데이터 기술을 활용하여 수 백 만의 올레TV 셋톱박스 채널 로그를 초 단위 미만으

로 분석하여 실시간 맞춤형 카테고리 전송

06 선박 신수요 예측플랫폼 및

MRO 서비스 모델 개발BIGDATA국 내 사 례

실시간 시청정보로 시청자 감성 사냥

올레TV

Page 133: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

133

실시간 시청정보로 시청자 감성 사냥

올레TV

- CEP 아키텍처 기반으로 데이터가 수집되는 즉시, 실시간 전 처리, 실시간 계산, 실시간 패턴분석을 통

해 데이터 분석 제공

[그림] 추천시스

- 실시간 데이터 처리 인프라 구축과 의사결정 지원을 위한 시각화 기능 제공

• 6백만 가입자의 채널, VOD 시청정보를 실시간으로 수집 및 분석하여 요구사항에 대해 실시간

채널 / VOD 시청률 분석 시스템 구축 상용화 및 운영

- 고객이탈방지 및 고객 군별 차등화 캠페인 구현을 위한 수단으로 활용

- 테마에 맞는 콘텐츠 맵핑 미디어와 콘텐츠 분야에 특화된 노하우를 바탕으로 차별화된 테마를 고객별

로 제공

- 실시간 방송 채널과 VOD 시청 이력 등 콘텐츠 이용 방식을 분석해 가구 구성원을 추론하여 최적화된

콘텐츠 노출

시청자가 필요로 하는 정보를 적시에 노출시켜 리모컨 하나로 간편하게 접할 수

있도록 실시간 감성 큐레이션 서비스 실시

올레 TV

[출처 : KTH, 2015]

• 유무선 VOC 실시간 분석

• 유무선 VOC 조회 / 검색

• 시각화

• 모니터링 / 일람

IDMS

계정정보

유선 VOC무선 VOC

시각화 엔진

Page 134: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

134

[그림] 올레 TV 실시간 인기채널 안내 화면

[그림] 고객 성향 분석 결과에 따른 맞춤형 서비스화면 노출

- 개인에게 최적화 된 추천 및 큐레이션을 위한 메타 데이터 검증 및 테마 생성

- 구매 이력과 가입자 정보를 활용하여 RFM(Recency, Frequency, Monetary) 모델에 근거한 고객 군 분

류로 특징 파악

[출처 : 올레 TV, 2015]

Page 135: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

135

2. 사용자의 수요와 요구 – 그에 맞는 최적 콘텐츠

• 다양한 콘텐츠 라이브러리를 고객의 욕구에 맞도록 적합한 서비스 제공

[그림] 행동패턴에 따른 고객 군별 RFM

효과 및 향후 적용 확대 방안

• 시청자 수, 지능형 서비스 활용 비율 증가 ‘확인’

- RFM(Recency, Frequency, Monetary) 으로 구분한 서비스 추천을 통해 시청자(고객) 수가 출시 당시에

비해 15배 증가

- 감성 추천, 의미기반 검색 등 고사양 셋탑박스의 지능형 서비스를 활용한 시청 비율이 30% 이상 차지

했으며 향후 실시간 감성 큐레이션과 같은 지능형 서비스의 지속 개발 예정

• 대용량 로그를 1/1000초 미만에 Realtime 처리하는 기술력 확보

- 실시간 전 처리, 실시간 계산, 실시간 서비스 유지

- 실시간 채널 및 VOD 통합 시청률 분석 시스템 구축, 운영

• 고객 불만 사항 발생에 대비하여 검색 엔진을 활용, 분석할 수 있는 솔루션을 통해 실시간 대

용량 데이터 분석으로 의견 접수 현황을 용이하게 파악

- 접수된 불만을 처리 알고리즘을 이용하여 사용자의 요구 사항을 분석에 대입

- 수집된 데이터를 통해 서비스 취약점을 분석하거나 개선안을 도출하고 향후 계획을 수립하여 이목을

이끌 수 있는 전략적 요소로 활용

[출처 : KTH]

RFM(5,5,5) : VVIP - 우수고객 차별 프로모션

RFM(1,1,1) : 해지 - 이탈 방지 프로모션

타겟 마케팅에 활용 - 고객군 분류/Smart Push

올레 TV

Page 136: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 137: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

01·노스페이스, 기계학습을 통한 지식 기반 상품 추천 서비스

02·페이팔, 딥러닝을 통한 온라인 사기 방지 시스템 구축 사례

03·스타캐스트, 빅데이터 기반의 MLB 중계 시스템

04·Travelbasys, 소셜 및 데이터 기반의 안전 여행 알림 서비스

05·DB Systel, 센서데이터 분석을 통한 기관차운행관리 개선 사례

06·오므론, 빅데이터 분석을 이용한 제품 생산성 향상

빅데이터 활용사례 - 해외

Page 138: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

138

사업의 추진 배경 및 목적

1. 슬슬 한계를 드러내고 있는 온라인 쇼핑몰 추천 서비스

• 기본적인 온라인 추천 서비스 제공은 이제 더 이상 새롭지 않아

- 온라인 쇼핑몰에서는 데이터를 활용해 고객들이 많이 찾는 제품들만 선정해서 보여주거나 평소와 비

교하여 저렴하게 책정된 가격의 상품을 한 곳에 모아 보여주는 핫딜(Hot-deal) 추천 서비스가 대다수

- 또는 소비자가 이전에 선택했던 상품을 모아서 한 번에 제공하는 개인 큐레이션 서비스를 제공하기

도 함

[그림] Amazon Hotdeal(Today’s deal)

01 AI를 이용한 ‘Expert Personal Shopper’로 보다

스마트한 상품 추천을 주도

노스페이스BIGDATA해 외 사 례

[출처 : Amazon.com]

Page 139: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

139

• 상품의 기능성에 대한 이해가 필요한 아웃도어용품

- 아웃도어 용품의 경우 오프라인 매장을 방문하는 소비자가 많은 이유는 일반 소비자에게 수많은 기능

이 집약되어 있어 상품에 대한 지식이 대부분 없기 때문

- 의류 매장에 경우 단순히 소비자가 원하는 디자인을 고르면 되지만 아웃도어용품의 경우 산악 관련 상

품의 기능에 대한 전문적 지식이 필요하기 때문에 사이트를 방문한 개인이 관심 제품 정보만을 노출하

는 것은 실제 구매까지 연결하는데 한계를 가짐

- 이처럼 단순한 개인화된 사이트 구성뿐만 아니라 방문하고자하는 지역과 용도, 그에 맞는 기능을 갖춘

상품을 전문 지식과 함께 제공하는 추천 서비스가 필요

추진 내용

1. 소비자 욕구에 특화된 목적 지향 상품 추천 서비스 구현

• 기능성 이해도 증진을 위해 상품과 관련된 빅데이터 수집·분석

- 해당 상품에서 제품을 선택할 때 소비자가 따라가는 상품에 대한 쇼핑몰 고객의 판매 내역과 해당 사

용자의 리뷰 등 상품 관련 데이터에 대한 정보 수집 및 분석

- 쇼핑몰 내에 수집되는 데이터 외에도 기존 오프라인 매장 판매자의 상품 판매와 관련된 소비 패턴을 데

이터화하고, 상품과 관련된 개인블로그 및 산악 잡지, 아웃도어 간행물의 데이터 수집을 통한 상품 분석

• 인공지능(AI) 대화상자를 통한 특화된 상품 추천

- 구매자가 원하는 특정 상품을 바탕으로 인공지능 기반의 대화 상자에서 구매하고자 하는 상품의 세부

내용을 입력하여 상품을 추천

전문 지식 전달이 상품 구매로 이어지는 특성을 가진 아웃도어 상품 – 추천의 새

로운 장을 열다

노스페이스

Page 140: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

140

- 인공지능 대화 상자를 통해 방문하고자 하는 지역과 필요한 상품의 요건 등 구매하고자 하는 상황을

파악하고, 해당 지역의 날씨 및 지형 등의 환경적 요인을 분석하고, 전문가의 사용 평가 및 산악용품 사

용 후기 등을 종합적으로 분석하여 조건에 충족하는 상품을 화면에 제공

- 오프라인 매장에서만 얻을 수 있었던 정보와 지식을 온라인 쇼핑몰에서도 소비자에게 제공하게 되면서

온라인 쇼핑의 이용률을 높일 수 있고, 사이트를 방문하는 고객의 쇼핑몰 이동, 클릭, 탐색 데이터와 인공

지능 커뮤니케이션 데이터를 통해 보다 적합도가 높은 상품 및 지식 제공이 가능하도록 시스템을 구축

[그림] 인공지능 질의를 통한 데이터 분석 프로세스

효과 및 향후 적용 확대 방안

1. 추천 상품 클릭률 평균 60% 달성

• 재방문 의사를 밝힌 소비자가 대다수

- 2014년 카카오에서 발표한 자료에 따르면 평균 업종별 광고 클릭률은 7.4%, 최적화 광고 클릭률은

8.5%를 기록하였는데, Fluid의 ‘Expert Personal Shopper’의 경우 추천 상품에 대한 클릭률은 60%로 소

비자의 취향을 정확하게 저격

- 온라인 쇼핑몰에서 고객들이 대화박스에 참여한 시간은 평균 2분을 기록

[출처 : IBM]

Page 141: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

141

- Fluid의 ‘Expert Personal Shopper’를 사용했던 소비자들은 대부분 높은 만족도를 나타내며 해당 사이트

를 다시 사용할 것이라고 평가

[그림] Expert Personal Shopper 화면

[출처 : Northface]

<아웃도어 제품 구매의 질문 타이핑>

<아웃도어 제품 구매의 질문 타이핑>

<필요한 제품의 추천>

<필요한 제품의 추천>

노스페이스

Page 142: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

142

사업의 추진 배경 및 목적

1. 진화하는 온라인 사기, 소비자는 혼란 속으로

• 온라인 사기 갈수록 증가하고, 지능적으로 진화

- 소비자의 개인정보를 불법으로 취득하려는 피싱사기가 유명 온라인 쇼핑몰이나 은행 그리고 SNS사이

트로 교묘하게 위장하며 소비자들을 혼란에 빠뜨리고 있음

- 신종 온라인 피싱은 불특정 다수를 향한 기존 행태에서 벗어나, 피해 대상이 되는 개인의 이메일 주소 등

개인정보를 미리 확보한 후 해당 사이트와 동일한 로고와 이메일 형식으로 개인정보의 변경을 요청하거

나 결제를 요구하는 행태를 보여 피싱사이트와 정식 웹사이트의 구분이 갈 수로 어려워지고 있는 실정

[그림] 다양해진 사기 수법

02 딥러닝 갑옷 입고 온라인 사기 ‘수호신’ 자처

페이팔BIGDATA해 외 사 례

[자료 : 조선일보, 2015]

<보이스 피싱>

<스미싱>

<파밍>

<메모리 해킹>

Page 143: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

143

• 다양해진 사기수법으로 각별한 주의 필요

- 지능화된 피싱메일의 링크를 의심하지 않고 눌렀을 경우 일차적인 정보누출의 피해뿐 아니라 스파이

웨어나 해킹프로그램에 감염될 위험성이 높아 소비자들의 각별한 주의가 필요

- 스마트폰을 통한 피싱사기도 점차 증가하고 있는데, 대부분의 소비자들이 스마트폰의 앱을 다운로드

받을 때 특별한 경계를 하지 않는 점과 스마트폰에서는 웹페이지에 입력된 정보를 지우지 않고 저장

하는 습관이 있는 점에 착안하여 범죄자들이 스마트폰 앱에 해킹프로그램을 설치하는 사례가 증가하

고 있음

2. 온라인 사기 피해 – 사전 예방이 ‘중요’

• 현실과 동떨어진 예방 방법은 ‘문제’

- IT업계 전문가들은 이러한 온라인 피싱사기를 사전에 방지하기 위해서는 대부분의 상품구매나 금융거

래와 관련된 이메일을 받을 경우 그 내용이 거래내역확인 이상을 요구한다면 무시할 것을 주문

- 받은 이메일에 포함된 링크 URL을 클릭하지 말고 해당 사이트에 직접 접근하여 로그인을 하거나, 링크

URL을 클릭하지 말고 커서를 올려만 놓게 되면 링크의 주소를 확인할 수 있어 피싱메일을 소비자가

직접 걸러낼 수 있다고 조언

• 소비자의 눈높이에 맞지 않는 조언, 소비자는 “글쎄...”

- 피해를 입은 소비자는 다양한데, 전문가의 조언은 전문용어만 나열하여 IT와 친숙하지 않은 소비자들은

이해하기도 어려움

- ‘사후약방문(死後藥方文)’ 격의 조언으로 피해를 입은 후에야 대책을 마련해 소비자들이 이미 입은 피

해는 되돌릴 수 없음

빅데이터 활용한 딥러닝 기술, 온라인 결제 안전 ‘지킴이’

페이팔

Page 144: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

144

추진 내용

1. 페이팔의 결제 사기 대응책 - ‘딥러닝’ 도입

• 페이팔, 훨씬 복잡해진 사기수법을 분석 및 예방하기 위해 ‘딥러닝(Deep Learning)’ 기술 도입

- 국내에서 논의가 한창인 이상금융거래탐지시스템(FDS, Fraud Detection System)의 원조격으로 페이팔

은 사람의 뇌와 유사한 방식으로 분석업무를 수행하는 ‘딥러닝(Deep Learning)’ 기술까지 적극 도입

- 페이팔 글로벌 리스크 사이언스 담당 선임디렉터인 후이 왕(Hui Wang)은 “사기 수법이 이전보다 훨씬

복잡해지면서 사기분석 및 예방을 위해 딥러닝 기술을 도입하고 있다.”고 밝힘

• 빅데이터를 활용한 딥러닝 기술은 빅데이터 융합 인식기술

- 딥러닝 기술은 머신러닝(Machine Learning) 혹은 인공지능(Artificial Intelligence)에 대한 또 다른 접근법

중 하나이며, 구글, 페이스북, 마이크로소프트, 바이두 등이 수년간 연구해 온 분야

- 사람의 뇌가 정보를 처리하는 방식과 유사한 인공 신경세포 네트워크 알고리즘을 사용하며, 이 알고리

즘은 뇌에서 영감을 얻어 유사한 분석시스템을 마련하는 것으로 뇌 자체를 모델링하는 것과는 차이를

보임

- 딥러닝을 구성하는 인공 신경세포 네트워크는 이를 구현한 시스템이 얻은 데이터의 패턴이나 특징을

이해하는 데 뛰어나며, 컴퓨터 비전, 음성인식, 텍스트 분석, 비디오 게임 등의 발달이 모두 여기에 영향

을 미치고 있음. 따라서 복잡한 패턴과 특징을 가진 사이버범죄 혹은 온라인 결제사기를 확인하는 데에

도 도움

※ 참고 : 딥러닝 기술

- 딥러닝은 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술이다. 예를 들어 컴퓨터는

개와 고양이를 구분하지 못하나 사람은 구분할 수 있다. 이를 위해 ‘기계학습’이라는 방법이 고안

되었는데, 이는 많은 데이터를 컴퓨터에 입력하고 비슷한 것끼리 분류하도록 하는 기술이다. 이

때, 데이터를 어떻게 분류할 것인가를 놓고 많은 기계학습 알고리즘이 등장했는데 ‘의사결정나

무’, ‘베이지안망’, ‘서포트벡터머신’, ‘인경신경망’이 그 예이다.

Page 145: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

145

[그림] 딥러닝 기술을 활용한 ‘딥 페이스’

[자료 : GIGAOM, 2015]

- 딥러닝은 인경신경망의 한계를 극복하기 위해 제안된 기계학습 방법으로 인간의 두뇌가 수많은

데이터 속에서 패턴을 발견한 뒤 사물을 구분하는 정보처리 방식을 모방해 컴퓨터가 사물을 분

별하도록 기계를 학습시킨다.

- 딥러닝 기술을 적용하면 사람이 모든 판단 기준을 정해주지 않아도 컴퓨터가 스스로 인지·추

론·판단할 수 있게 되며, 음성·이미지 인식과 사진 분석 등에 광범위하게 활용된다. 이에 따라

구글, 페이스북, 마이크로소프트, 바이두 등의 기업들이 딥러닝 기술을 적용하여 데이터를 분석

하는 등 서비스에 활용하고 있다.

2. 페이팔의 딥러닝 기술, 효과는 ‘톡톡’ 전략 가치는 ‘쑥쑥’

• 페이팔이 도입한 딥러닝 기술, 사이버범죄와 온라인사기를 확인하는데 뛰어난 효과

- 사기방지 전문가와 결합해 ‘탐정이 하는 것과 같은 방법론(Detective-like Methodology)’를 적용할 수 있

게 함

- 전 세계에서 이뤄지는 온라인 결제에서 발견된 수 만개의 잠재적인 특징을 분석해 특정 사기유형과 비

교하거나 사기방식을 탐지하고, 다양한 유사수법을 파악할 수 있게 함

페이팔

Page 146: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

146

- 다양한 사기수법들은 누군가 X라는 일을 했을 때, Y라는 결과가 나오는 것보다 훨씬 복잡하며 이에 따

라 사람이 할 수 있는 것보다 훨씬 높은 수준의 분석이 필요

- 딥러닝을 통해 사기가 가능한 모델이 탐지되면 사기방지 전문가는 현실에서 일어날 수 있는 일인지, 다

음에 무슨 일이 발생할 수 있는지를 파악

[그림] 페이팔의 온라인 사기 필터링 화면

• 페이팔의 딥러닝 모델, ‘왕’의 자리에 점점 다가서

- 페이팔은 ‘챔피언-챌린저(Champions-and-Challengers)’방식의 접근법을 사용

- 전통적인 챔피언-챌린저 방식에서, 새로운 전략(챌린저)이 기존에 사용 중인 전략(챔피언)보다 뛰어나

다면, 새로운 챔피언 전략으로 선택

- 이런 과정은 결과에 대한 챌린저 모델을 적용해봄으로써 새로운 전략이 나타낼 결과를 미리 예상할 수

있으며, 프로그램의 90%가 챔피언 모델을 통해 처리되는 동안 나머지 10%는 챌린저 모델을 통해 처리

됨. 최종적으로 결과를 비교해서 더 우수한 전략을 선택함

- 페이팔은 이런 접근법을 통해 어떤 사기탐지 모델에 무게를 둘지를 결정하고 있으며, 딥러닝에 의한 방

식은 새로운 전략(챌린저)에서 출발하여 점점 새로운 챔피언 모델로 자리를 잡음

[자료 : GIGAOM, 2015]

Page 147: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

147

효과 및 향후 적용 확대 방안

1. ‘딥러닝’ 도입으로 온라인 사기 차단 가능성 높여

• 치밀함과 호환성을 담보한 알고리즘

- 다중시스템 클러스터에서의 실행을 위한 알고리즘의 분배는 필요조건이기 때문에 힌튼(Hinton)의 딥러

닝 알고리즘을 사용하였으며, 여러 시스템에서의 활용성을 높이기 위해 그라지아(Grazia)가 제시한 가

이드라인을 따름

[그림] 페이팔의 딥러닝 알고리즘

① 마스터 노드를 통해 RBM(Restricted Boltzmann Machines)의 가중치를 초기화

② 마스터 노드를 통해 가중치를 부여하고, 작업자 노드를 쪼갬

③ 작업자 노드는 1개의 데이터세트 사건을 위해 1개의 RBM계층을 다룸, 즉 쪼개져 있는 전체적인 작업

자 노드를 통해 완성된 부분(업데이트 된 가중치)을 다시 보냄

④ 마스터노드는 하나의 주어진 사건을 위해 모든 작업자 노드로부터 얻은 가중치를 평균함

⑤ ③단계 ~ ④단계의 과정을 미리 정의된 사건의 집합에 대해 반복

⑥ ⑤단계까지 거치면 RBM 1개의 계층이 완성되며, 동일한 과정을 RBM 전체 계층에 걸쳐서 반복

⑦ 모든 계층이 완료된 후, 잘 조율된 결과를 다시 전파

[자료 : 페이팔 Engineering, 2015]

Master

Data Spilt 1 Data Spilt 3

Data Spilt 2

Worker

Worker Worker

Batch 1 Batch 1

Batch 1

Batch 2 Batch 2

Batch 2

Batch 3 Batch 3

Batch 3

페이팔

Page 148: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

148

• 사이버범죄 및 온라인 사기 패턴 분석의 정확도 제고

- 60,000개의 트레이닝 사진과 10,000개의 실험 사진을 통한 모의실험을 RBM 계층 당 히든 유닛의 수

(1개의 작업 노드에 들어가는 사진의 수)를 증가시킨 결과 히든유닛이 많을수록 Error Rate(%)가 점차

감소

- 온라인 사기 사이트의 데이터를 딥러닝의 알고리즘 통해 분석하여, 사기 사이트 여부를 보다 정확히 판

단할 것으로 기대

[그림] 딥러닝 테스트 결과

Hidden Units per layer Total Units Error Rate(%)

100 - 100 - 100 300 2.78

500 - 250 - 100 850 2.33

500 - 500 - 250 1250 2.13

500 - 500 - 500 1500 1.98

500 - 500 - 1000 2000 1.77

500 - 500 - 2000 3000 1.66

[자료 : 페이팔 Engineering, 2015]

Page 149: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 150: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

150

사업의 추진 배경 및 목적

1. 팬들의 외면, 시청자의 고령화, 새로운 대안마련 필요

• 야구에 대한 관심 하락, 젊은 층의 외면

- 146년 역사(1869년 설립)를 지닌 MLB(Major League Baseball)는 1950년대 까지 가장 인기 있는 스포

츠였으나 TV의 등장 이후 NFL(National Football League)이 등장하면서 전세가 역전

- NFL의 역동성은 시청률, 스폰서십, 구단용품 판매 등 다양한 분야에서 메이저리그를 앞서기 시작했으

며 야구팬의 고령화 및 시청자 수 감소로 향후 대책 마련이 필요

- 2014년 TV로 MLB를 시청하는 팬의 50%는 55세 이상으로 10년 전 41%보다 9%p 증가하였고, ESPN

의 시청률 조사에서도 MLB팬의 평균 연령은 53세로 NFL(47세), NBA(37세) 보다 높은 것으로 나타남

- 1978년~1982년 3,800만 명이 월드시리즈를 시청하였으나 2014년 시청자 수는 1,380만 명으로 64%

가 급감

[그림] 2014년 미국 내 가장 인기 있는 스포츠 순위

03 선박 신수요 예측플랫폼 및

MRO 서비스 모델 개발BIGDATA해 외 사 례

Statcast로 구현된 빅데이터 야구 실현

메이저리그

[출처 : FTW(USA Today Sports site)]0

[미식축구리그 ] NFL

[대학미식축구 ] NCAAF

[자동차경주 ] Auto Racing

[프로농구 ] NBA

[대학농구 ] NCAAB

[아이스하키 ] NHI

[메이져리그 ] MLB

10% 20% 30% 40%

Page 151: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

151

Statcast로 구현된 빅데이터 야구 실현

메이저리그

추진 내용

1. ICT 기술과의 접목을 통해 보다 역동적인 야구 중계를 실현

• 투구, 타구, 선수들의 움직임을 모두 포착하는 Statcast 시스템 구축

- MLB는 2015년 시즌부터 투구는 물론 타구와 선수들의 움직임을 모두 포착하는 Statcast 시스템을 30

개 구장 모두에 설치하고, 공의 궤적을 추적할 수 있는 레이더 장비업체 트랙맨(Trackman)과 영상 장비

업체 카이론히고(ChyronHego)와 협력

- 덴마크의 레이더 회사 트랙맨(Trackman)에서 들여온 도플러 효과1)를 이용한 레이더 카메라를 이용하

여 공의 궤적을 분석하고, 카이론히고(ChyronHego)의 카메라는 모든 선수들을 1초당 30개의 사진으로

찍어 움직임을 추적하고 분석

[그림] Statcast를 통한 투수간 비교 분석

경기영상과 기록 - 빅데이터 분석을 통해 야구를 보는 새로운 재미 제공

메이저리그

[출처 : MLB]

1) 도플러 효과 : 레이더 카메라가 전파를 발송하면 날아오는 공으로 인해 반사전파의 진동수가 증가하는데, 진동수 변화

로 속도와 궤적을 측정

Page 152: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

152

- 메이저리그는 Statcast 시스템을 통해 모든 경기 이닝마다 투수의 피칭, 타자의 배팅, 타구에 대한 수비

수들의 움직임 등을 추적하고 기록

- 이 엄청난 양의 데이터는 메이저리그를 분석하고 운영하는 방송사는 물론 통계 및 분석 전문 회사를

통해 가공되어 공급됨에 따라 경기를 즐기는 방식이 크게 변화할 것으로 기대

• 데이터 야구에 대한 새로운 기대

- 축적된 기록은 세밀한 통계 분석을 가능하게 해 야구의 흥미를 배가했고 그 흐름은 과학적 통계로 야

구를 분석하여 의미 있는 인사이트를 찾아내는 것에 초점을 맞춤

- 투구 분석뿐만 아니라 타구와 선수의 움직임을 모두 처리한 데이터양은 경기당 3TB~7TB에 이르며 미

국 메이저리그 사무국의 자회사인 MLBAM(MLB Advanced Media)을 통해 모든 데이터를 무료로 공개

하고 있으며 누구나 접근이 가능

※ 빅데이터가 공공재가 되면 야구에 대한 지식과 방법론이 리그나 하나의 구단이 주도할 때보다 훨씬

발전될 것으로 기대

[그림] 실시간 데이터 분석을 통한 경기 중계 및 기록 관리

2. 빅데이터를 통해 빠르게 변화하는 MLB

• 수치화된 실시간 데이터, 새로운 야구 중계를 선보여

- Statcast 시스템은 투구의 속도와 궤적, 공의 회전 방향부터 투수의 보폭과 자세를 보고 타자가 예측하

는 속도와 어떻게 다른지 까지 분석

Page 153: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

153

- “투수의 공 끝이 밋밋하다”, “배트의 스피드가 부족하다” 등 해설자의 개인적인 표현이 중심이던 이전

중계와 달리 구속(km/h), 타구속도(km/h), 비거리(m) 등 실질적인 수치 중심의 중계가 가능

• 보다 역동적인 방송 중계를 실현

- Statcast 시스템은 모든 선수들을 1초당 30개의 사진으로 찍어 움직임을 추적· 분석, 타격 후에는 기

후에 따라 어떻게 공이 날아가며, 수비수들의 반응과 공이 떨어지는 지점까지 얼마나 효율적으로 움직

였는지도 추적하여 보다 역동적인 중계가 가능

- 또한, 경기장 안에서 선수와 공의 움직임을 다양한 각도에서 시각화된 이미지를 추가해 보여주어 보다

흥미롭게 TV 중계

- 팬들의 경우 스마트폰을 통한 심판의 아웃/세이프 판정 등이 정확하게 이루어졌는지 곧바로 살펴볼 수

있는 실시간 인스턴트 리플레이 등 이전보다 고품질, 고차원의 야구 중계 경험이 가능

[그림] Statcast를 통한 TV 중계 시연

메이저리그

[출처: Phys.org]

Page 154: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

154

효과 및 향후 적용 확대 방안

1. 빅데이터, MLB 구단의 새로운 동력으로 부각

• Statcast, 선수에 대한 객관적 평가 자료로 활용

- 첨단 ICT 기술과 빅데이터가 결합한 Statcast 시스템은 선수 개개인의 객관적 평가 자료로 활용 가능

- 예를 들어 2015년 MLB 선수들 중 가장 빠른 선수로는 도루왕 디고든으로 알려져 있으나 Statcast를 통

해 실질적인 통계를 분석하니 텍사스의 델리노 드실즈가 가장 빠른 선수로 나타남

- 델리노 드실즈는 Statcast로 스피드를 측정한 결과 121경기에서 110번 출장하여 21마일(33.8km/h) 이

상 속도의 주루플레이를 총 132번 기록

- Statcast를 통한 데이터는 선수의 기량을 정확히 측정·파악하거나 향상하는데 도움을 주고, 상대팀의

투수와 타자를 분석하여 경기전략 마련이 가능하며, 선수영입에 있어 빅데이터를 이용하여 시장에서

저평가된 선수를 영입하여 예산의 효율적 사용이 가능

[그림] MLB 주요 선수들의 21마일 이상 주루 플레이 현황

• 빅데이터 기술은 경기, 선수 운영 측면뿐만 아니라 대형 스포츠의 팬 서비스와 마케팅 목적으

로 활용이 가능

- 빅데이터 기술은 경기분석과 선수의 경기력 향상, 팀의 승률 예측, 경기 전략 수립, 스포츠 방송, 광고

등 다양한 영역에서 적용되면서 스포츠 비즈니스의 양상을 변화

[출처 : BaseBallGen.com]

0

10

200

20

30

40

50

60

80

70

100

110

120

130

DelinoDe Shie lds

Dee Gordon BillyHamilton

StarlingMarte

Jose Altuve CesarHernandez

LorenzoCain

JarrodDyson

90

Page 155: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

155

- 팬들은 개방된 빅데이터를 통해 직접 대량의 정형/비정형 기초데이터로부터 새로운 의미를 추출하고,

가상적으로 조작하여 결과를 분석하는 등 새로운 차원의 경험이 가능

2. MLB, 빅데이터를 통해 새로운 비즈니스 창출을 기대

- 빅데이터 효용은 데이터 분석을 통해 고객이 만족하는 새로움 상품이나 서비스 개발에 있음

- Statcast를 통해 만들어진 빅데이터는 다양한 채널을 통한 야구 중계는 물론 게임, 마케팅, 스포츠 교육

등 다양한 분야에서 활용이 가능

- Statcast는 아직 초기 단계로 향후 기술이 진보하면서 야구의 새로운 진화는 불론 다양한 산업에서 활

용될 것으로 예상

메이저리그

Page 156: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

156

사업의 추진 배경 및 목적

1. Travelbasys 소개

- 1972년 설립되어 ‘효율적인 관광 프로세스에 대한 귀하의 IT 파트너’이라는 슬로건 아래 혁신적인 IT 시

스템 개발 솔루션을 여행 관련 산업에 공급

- 1천 2백 개 이상의 여행 회사와 IT 통합 및 자동화 서비스를 성공적으로 지원해 왔으며, 80억 유로 이

상의 매출액과 1천 2백만 관광지 데이터와 2천 2백만 명 이상의 여행자 프로파일을 보유하고 있으며

매 월 새로운 정보가 갱신

- 여행 산업에 대한 중요한 IT 시스템 솔루션을 간단하고 저렴하게 공급하여 고객이 사용할 수 있도록 세

상의 모든 여행 업체와 제휴하여 상호 성공하는 비즈니스 라이프 관계를 추구

2. 걱정 없이 여행을 즐길 수 있는 방법이 없을까

• 여행 중 사고를 당하는 여행자가 증가함에 따라 실시간 여행객 보호를 위한 자동 경보 시스템

개발 필요성 대두

- 소셜 네트워크에서의 여행 관련 데이터는 불확실한 정보가 많아 신뢰성 확보가 어려움

- 보도 자료나 기관이 보유한 자료를 실질적으로 유용한 데이터로 가공하여 신뢰성과 정확성을 갖춘 여

행지 관련 위험 정보 확보

• 대한민국 해외여행 정보 안내 서비스

- Travelbasys의 빅데이터 기반 여행 정보 제공의 큰 특징은 실시간으로 관련 정보를 최신화하여 공급하

기 때문에 여행자들이 자신의 환경에 맞도록 상황 반영 가능

04 안전한 여행을 위한 빅데이터 분석

TravelbasysBIGDATA해 외 사 례

Page 157: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

157

- 국내에서는 외교부 주관으로 해외여행 안전과 관련된 정보를 제공하고 있지만 업데이트가 일정 간격

으로 진행되기 때문에 최신 정보 반영은 상대적으로 속도가 느림

[그림] 해외여행 안전 단계 안내 서비스(외교부)

• 안전한 여행을 위한 정보 안내를 위하여 오랜 시간 축적된 데이터를 환경에 따라 체계적으로

분석하여 여행객에게 위협이 되는 요소를 사전에 인지

- 다양한 경로에서 수집되는 자료를 통해 여행 위험 데이터를 확보하고, 기존의 데이터와 비교하면서 신

뢰도 향상에 밑거름이 될 수 있는 데이터로 가공

여행객의 안전을 위한 실시간 여행 자동 경보 시스템

Travelbasys

[출처 : 대한민국 외교부 해외안전여행(www.0404.go.kr)]

Page 158: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

158

[그림] 2015년 전 세계 여행 위험 지역 표시

추진 내용

1. 지역 정보 및 관련 정보를 통해 위험도 예측 알고리즘 개발

• 언론 보도나 소셜 네트워크에서 확보된 데이터에 폭동, 자연 재해, 전염병 등의 위험 요소를

입력하여 실시간 데이터 처리를 통해 여행 경로에 대한 위험도 확인

- 데이터 분석을 거쳐 위험 요소를 도출하여 현재 여행객의 위치 등 상황에 맞는 정보를 제공하고 실시

간 업데이트를 통해 신속하게 적용하여 실시간 안전 상황을 확보

[그림] 개별 소스의 대량 데이터 처리 모델

[출처 : 나무위키]

[출처 : Travelbasys, 2015]

노랑 - 여행 주의(한국으로 치면 여행 유의) 특별한주의 요청

귤색 - 여행 연기(한국으로 치면 여행 자제) 불필요한 여행 자제

주황 - 여행 중단(한국으로 치면 옛 여행 제한 & 철수 권고) 여행을 멈추어야하는 지역

빨강 - 대피 권고(한국으로 치면 여행 금지) 머물러있다면 즉시 나가야 할 지역

Datenquellez.B Pressemitteilungen

Datenquellez.B Facebook

Datenquellez.B Twitter

FARM

DSDM

Warnunern

CEP

Page 159: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

159

- 여행 일정과 경로에 따른 위험도를 분석하고 관리하는 Back-office Solution을 결합하여 전체 여행 위험

도에 대한 데이터 분석 시스템 구축

- 수집된 자료는 DB화하여 빅데이터 기반의 맞춤형 정보로 재가공 되고, 이를 토대로 여행객에게 필요한

정보를 제공

• 자동화된 데이터 분석을 통한 실시간 상황인식으로 여행 위험성을 경고(날짜, 지역 등)

- 페이스북, 트위터 등의 사회 관계망 서비스와 보도 자료에서 수집된 최신 데이터를 자체 알고리즘에 따

라 분류 – 검증하고 이들 대량의 데이터를 분석하여 여행의 대체 노선(경로) 제시

- 여행에 위험을 미칠 수 있는 요소들을 특정 주제나 키워드를 통해 실시간으로 메시지 탐지

• 특정 날짜에 대한 위험 정보와 환경 안내

- 여행자의 안전과 관련된 데이터가 필요성과 시기에 따라 자동적으로 필터링됨

- 여행 위험에 영향을 미칠 수 있는 관련된 행동 패턴이나 정보를 구체화하여 제공

[그림] 모바일로 제공되는 여행지 위험 경보

[출처 : 베를린 하이델베르크]

Travelbasys

Page 160: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

160

2. 작은 것도 놓치지 않는 세심함

• 새로운 서비스를 기존 보다 저렴한 비용으로 제공하여 많은 여행객이 혜택을 받을 수 있는 체

계 구성

- 소셜 기반 데이터 및 자체 구축 DB 뿐만 아니라 지리 정보 및 지역 정보 관련 기업과의 데이터 교환을

통해 위험 정보의 정확도를 향상시키고 예측력을 보다 강화하는 방향으로 분석을 진행

- 수집된 여행 관련 데이터를 저장하여 각각의 성격에 맞게 분류하고, 적절하게 가공하여 새로운 정보를

원하는 이에게 도움이 될 수 있도록 즉시 발송하는 체계 구축

[그림] 수집된 데이터가 가공을 거쳐 이용자에게 전달되는 과정

[출처 : ITESA]

Scan Match PushIdentify & Verify

Page 161: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

161

효과 및 향후 적용 확대 방안

1. 데이터의 축적 및 알고리즘 개선을 통한 서비스 확장

- 누적 데이터 분석을 통해 보다 정밀한 위험 예측 알고리즘을 개발하여 관련된 서비스의 확장 및 개선

계획

- 개별 여행에 한해 단편적 정보만을 다룰 수 있는 수준에서 벗어나 향후에는 다양한 검색 및 조건으로

보다 신속한 여행 위험 경고가 가능한 단계로 발전시킬 계획

Travelbasys

Page 162: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

162

사업의 추진 배경 및 목적

1. 철로 관련 사고는 언제나 대형사고 – 사전 예방 필요성 대두

• 시설 유지 및 기관차 문제에 따른 철도 운송 중단 예방을 위해 실시간 상황 탐지 필요성 대두

- 독일 내 5천 7백 개의 기차역과 3만 4천여 km에 이르는 철도 네트워크가 원활히 작동하기 위해서는

철도 및 기관차의 유지와 보수를 위한 예측과 분석이 반드시 필요하며, 이 문제를 매우 긴급하고 중요

한 문제로 인식

[그림] 철로, 기관차 보수 및 정비

- 정비 관련 숙련자에 의지하는 예방 및 정비를 데이터 분석에 기반한 시스템으로 변경하기 위해 다양한

데이터 수집 방법과 분석 방법을 연구

05 센서를 이용한 기관차 관리

DB SystelBIGDATA해 외 사 례

[출처 : DB Systel, 2015]

Page 163: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

163

[그림] DB Systel의 빅데이터 센서를 부착한 기관차의 역내 진입

• 철로에서의 열차 사고는 상당한 비용, 운송 지연 그리고 만족/신뢰도 하락의 원인

- 철도가 독일 사회에서 차지하는 비중을 고려할 때, 한 기관차의 연착은 전체 철도 스케줄에 악영향

- 철로나 기관차 손상을 복구하기 위한 부품 교체 값은 매우 고가이며 단시간 내에 수리를 기대하기 어

려운 시스템

기관차의 원활한 운행과 순환 시스템 확립을 위한 빅데이터 활용

DB Systel

[출처 : DB Systel, 2015]

Page 164: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

164

[그림] 타 교통 및 이용객과 연계된 시스템 구축

추진 내용

2. 기관사의 ‘경험’보다 데이터 분석 기반의 관리시스템 추진

• 운영 상황 정보를 실시간으로 담아 인지 가능한 빅데이터로 즉시 가공

- 상황 진단 과정에서 사람의 예감이 아닌 근거에 기반한 효과적 조치 가능

- 부착된 센서가 기관차나 시설의 상태 변화를 감지하거나 환경을 신속하게 분석하여빅데이터화

- 문제 발생 시, 센서가 패턴을 감지하여 관리자가 디스플레이 형태로 인식 가능하도록 전송

• 기관차에 부착된 센서를 통해 기관차 유지, 보수에 필요한 온라인 진단 데이터 시스템 및 관련

인프라 구축

- 유지와 보수가 필요한 부분에 대해 일정 기간 그 내용을 리스트로 만들어 예방 · 정비에 활용하며 작

업장에서 유지·보수를 진행하는 순간에도 데이터 수집이 가능

[출처 : DB Systel, 2015]

Administraition

Intermediate

Aviation

Rail

Street

Traveller

Group

Page 165: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

165

[그림] 기관차 관리 빅데이터 플랫폼 체계

• 기관차의 운행·상황 관련 데이터를 지속적 생성하고 관리자가 인지

- 기관차 센서에서 데이터가 일정 간격으로 전송되나 관리자는 상황에 따라 수동 컨트롤 가능

- 문제를 빠르게 파악하여 유지와 보수에 정기적으로 적용하고, 정확한 대처가 진행 될 수 있는 관리

분야의 유용성 확보

- 실시간 모니터링으로 상황을 신속, 정확하게 파악한 후 원격 진단이 가능한 체계 수립

효과 및 향후 적용 확대 방안

1. 우리 곁에 안전한 철도

• 센서에서 생성된 데이터에 기반한 실시간 통합형 운행 스케줄 관리

- 네트워크, 기상조건, 에너지 공급, 작업장 데이터, 스케줄 데이터 등을 통합한 실시간 관리로 운행 스케

줄 관리 가능

- 축적되는 데이터의 특징을 분석하여 발생 가능한 사고나 재발을 차단할 수 있도록 잠재적인 사고에 지

속적으로 대비할 수 있는 체계 마련

[출처 : DB Systel, 2015]

DB Systel

Page 166: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

166

[그림] 기관차의 문제 상황을 실시간으로 안내하는 디스플레이

• 여객·화물 수송의 안정적 운영을 위해 과거에 진단된 문제의 특징이 보관된 빅데이터를 토대

로 예측 모델 개발 계획 추진

- 사고 발생 시, 그 특징과 유형을 즉시 데이터로 저장하여 과거 사례와의 공통점이나 차이점을 면밀히

분석 후 적합한 조치로 이어지는 매뉴얼 마련

• 날씨나 노선 상태, 환경 등의 요소를 인위적으로 설정하고, 주기적 시뮬레이션 테스트를 진행

하여 문제 발생을 최소화

- 예측 자체가 매우 어려운 천재지변 상황이 발생했을 경우에 현실적으로 가능한 대비 체계와 방침 마련

- 피해가 예상되는 돌발적인 상황에서의 피해를 최소화하고, 신속한 정상 운영을 위한 컨트롤 타워 구성

[출처 : DB Systel, 2015]

Page 167: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 168: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

168

사업의 추진 배경 및 목적

1. 오므론 소개

- 산업용 제어기기 및 헬스 케어 제품을 주력으로 개발 생산하는 1948년에 설립된 일본 교토 소재 전자

회사로 생산 라인에 사용되는 기기를 통합 제어하는 Sysmac2) 자동화 플랫폼을 통해 제어기기 분야를

선도하는 지위에 있는 기업

- 제어기기·FA(공장 자동화) 시스템 사업이 일본 내 점유율 40%를 차지하고, 유럽, 북미, 아시아 등 세

계 80여 개국에서 사업 전개 중이며 최근 다양화되는 제조 현장의 경영 과제를 해결하기 위한 ‘솔루션

사업’에 주력

2. 단위 시간 내 더 높은 생산성 확보 방안 고민

• 숙련자에 의한 제조 공정 관리상의 비효율성 개선 필요

- 생산라인의 상태를 쉽게 파악하여 현장 직원이나 관리자 누구든지 시스템의 오류를 인지할 수 있는 환

경을 조성하고, 전체적인 진행 상황을 파악할 수 있는 시스템의 고안 필요성 대두

- 가동률 및 생산 리드타임(Lead Time)3)의 결과에 대해 현장에서 시각적으로 즉시 확인하거나 필요한 경

우 자료를 Excel이나 Web에서 확인할 수 있는 형태로 변환하여 분석할 수 있는 체계를 구성

06 빅데이터 활용으로 생산성 향상

오므론BIGDATA해 외 사 례

2) 기존의 PLC(Programmable Logic Controller) 기능과 모션 제어 기능을 하나로 묶은 오므론 주식회사의 국내외에서 사용

되는 등록 상표 명칭

3) 생산을 계획하여 공정에 착수하는 시점부터 제품이 완성되어 완제품 창고에 입고되는 시점까지의 기간

Page 169: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

169

[그림] 생산라인의 상황을 최신화 하는 데이터 실시간 전송 구조도

추진 내용

1. 비효율성이 나타나기 시작하는 생산라인

• 생산라인의 장치에서 시계열 데이터를 단계별로 변환하여 생산 상황을 개체별로 분석할 수 있

는 여건 마련

- 로그 수집 구조를 구축하여 유효하게 실시간으로 생산 상황을 파악하고, 데이터를 분석

- 각 장치가 방출하는 로그 데이터를 통합하여 생산 공정을 일련의 흐름으로 시각화

• 프로토타입 시스템 도입으로 생산라인 움직임과 개선점 감지

- 실증 실험에서 얻은 노하우를 바탕으로 실시간 이상(異常)을 감지

- 생산성에 문제가 발생하는 시간이나 공정을 정확하고 상세하게 파악

생산라인을 통과하는 모든 제품의 상황과 모습을 ‘타임 라인 데이터 시각화’로

가시화하여 관리

오므론

해석서버

공정 A 공정 B 공정 C 공정 D

Sysmac

Page 170: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

170

[그림] 생산라인 실증 실험 진행도

- PCB 제조 라인은 부품의 위치와 납땜이 필요한 부분을 그림으로 나타낸 ‘납땜 인쇄기’, 전자 부품을 회

로 기판에 접합하는 ‘고속 마이스터’, 부품이 접합된 회로 기판을 필요한 부분에 위치시키는 ‘다기능 마이

스터’, 그리고 위치된 회로 기판에 솔더(납땜)를 녹여 접합하는 ‘리프로 원자로’의 네 단계로 구성

- 제조 시설마다 제각각 존재하는 단편적 기록들을 특징 있는 데이터로 재생산 가능

• 품질 및 생산성 향상을 위한 솔루션-하드웨어 기술 접목

- 전기회로가 편성되어 있는 기판 표면 라인의 품질 및 생산성 향상을 위해 마이크로소프트의 솔루션과

후지쯔의 하드웨어 기술 접목

- 생산라인의 빅데이터 분석을 통한 시각화 및 개선점 추출

- 생산라인의 각 장치에서 발생하는 데이터와 조립라인의 흐름을 연계하여 시각화 구조 구축

- 실증 실험에서 얻은 노하우를 바탕으로 실시간 단위의 이상(異常)을 감지하여 라인 제어 방법을 연구하

고 적용

• 분석 플랫폼 제공으로 생산 정보를 다양한 측면에서 분석 할 수 있는 다양한 데이터베이스 구축

- 데이터 시각화로 현장 직원들의 의식에 가장 큰 변화가 나타남

- 생산라인을 살펴보는 시야가 넓어짐에 따라서 개인 담당 부분뿐만 아니라 생산라인 전체의 최적화를

위한 생각을 제안하기도 하여 1시간 당 생산 능력 향상에 도움

[출처 : 오므론, 2015]

납땜인쇄기

고속마이스터

다기능마이스터

리프로원자로

각 장치 로그데이터 빅데이터 분석처리

항목추출

개체 데이터 추출

공정 간 링크

가시화 결과

분석용DB

Sysmac

Page 171: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

171

[그림] 실시간 생산라인 현황 파악이 가능한 시스템

- 생산라인의 현재 상태가 나타나는 시각화 데이터를 보면 누구나 자신의 역할과 오류발생에 주의할 수

있으며, 생산라인의 현재 상황을 매우 수월하게 파악 가능하도록 구축

2. 비효율화 요소 및 지점 파악 수월

• 모든 제품의 생산 상황이 파악 가능한 시각화 화면 제공으로 효율과 비효율 부분의 포인트 파악

가능

- 시각화 테이블에 나타나는 라인의 간격이 좁아 간격이 빼곡한 경우 생산라인이 순조롭게 작동하는 상

황인 반면, 라인의 간격이 넓다면 어떤 문제가 발생했음을 나타냄. 이러한 상황은 숙련자의 직감과 경

험으로 쉽게 파악이 불가능했던 것으로, 개선점 파악이 보다 수월해짐

[그림] 생산성 효율성을 나타내는 시각화 결과 이미지

[출처 : 오므론, 2015]

[출처 : 오므론, 2015]

오므론

Page 172: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

172

[그림] 타임 라인 데이터 시각화에서의 생산 상황 화면

- 제품 생산에 어느 정도의 시간이 필요한지 표현하며 공정마다 발생한 오류 수 등을 버블 차트로 축적

하여 생산라인에서의 원활한 작동이 가능한지 여부를 실시간으로 확인

효과 및 향후 적용 확대 방안

1. 효율성 6배 상승효과

• 기존 6명 이상의 숙련자가 필요하던 문제 원인 분석이 빅데이터 시스템 도입으로 1명의 인력

으로 충분히 대응 (효율 6배 이상 증가)

[그림] 효율성 전후 비교

[출처 : 오므론, 2015]

[출처 : 오므론, 2015]

6시간 소요 1시간 소요

문제 원인 분

소요시간1/6

으로 단축

Page 173: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

173

- 생산성 저하 발생 공정과 그 원인이 보다 쉽게 파악되어 시간당 생산성이 30% 향상 되었고, 향후 개선

가능성은 더욱 높은 수준이 될 것으로 기대

• 보다 혁신적인 성능 향상을 목표로 Upgrade된 라인 관리 방법 연구 개발 계획

- 검사 공정 이미지 데이터 연계, 로그 품질 등 다양한 데이터를 매시업 하여 현장 기술 개선 또는 분석

등 다양한 분야로 활용 영역을 확대해 나갈 계획

[그림] 시간 당 생산성 증가율

오므론

1시간 당 생산성 증가율

증가율

15% UP

30% UP

향후 몇 개월

Page 174: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •
Page 175: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •

기획·작성 한국정보화진흥원ICT융합본부김성현, 남명기, 선미란, 사업담당자(시범사업)

문 의 K-ICT 빅데이터센터 [email protected]

주 소 대구광역시동구첨단로53(우41068)한국정보화진흥원

T.053-230-1114www.nia.or.kr/www.kbig.kr

본사례집의내용은한국정보화진흥원의공식견해와다를수있습니다.

본사례집의내용의무단전제를금하며,가공인용할때에는반드시출처를명기해주시기바랍니다.

본책자는방송통신발전기금으로제작되었습니다.

2016 글로벌 빅데이터

융합 사례집2015 빅데이터 시범사업 및 국내외 사례를 중심으로

비 매 품

Page 176: 글로벌 빅데이터EB%85... · 샘플 개발 프로세스 데이터 케이스id s사 작업id 작업자id 작업 시작시간 작업 종료시간 3. 분석 내용 및 기법 •