Bigdata Monthly Vol 32. August 2017 · 1일차 Track 110:00～10:50(50분)- 센터 및 KBiG 분석툴 소개 NIA Track 2 11:00～18:00(360분) - Pig 소개 및 사용 방법 - 빅데이터

Bigdata Monthly Vol 32. August 2017

- 2 -

사업소개 부탁드립니다.

◾ ‘빅데이터 플래그십 시범사업’은 확산 및 파급 효과가

크며, 현장에서 활용 가능한 구체적인 빅데이터 선도 성공사례를 발굴하고 전파하는 사업입니다. 교통, 의료, 환경, 안전 등 다양한 분야에서 국민이 체감할 수 있는 성공사례의 확산을 통해 사회 현안을 해결하고, 인공지능, 딥러닝과 같은 지능정보기술을 적용한 신서비스 개발과 융합 신산업 분야에서 우수 빅데이터 모델을 발굴·상용화 하고 있습니다. 향후에는 시범사업 수행 분야의 데이터 공유·연구 활성화를 위한 분야별 빅데이터센터를 설립하고 운영할 계획입니다.

플래그십 시범사업의 지원내용은 무엇이며, 과제 선정은 어떤 방향으로 진행되나요?

◾ ‘빅데이터 플래그십 시범사업’은 기업들이 빅데이터를 활용해 경쟁력을 강화하고 새로운 비즈니스 가치를 창출할 수 있도록 정부출연금을 지원합니다. 정부출연금 총 규모는 31억원(2017년 기준)으로, 컨소시움별 지원금은 평가결과 및 심의결과에 따라 매칭펀드 방식으로 차등 지원합니다. 과제 선정 기준은 빅데이터 사업으로서의 적합성, 지능정보화 기술적용, 대국민 체감 효과, 성과확산 계획의 우수성, 제안기관의 추진의지 등을 고려하며, 공공·민간 데이터 활용 또는 융합 서비스 등 선도적인 개념의 대국민서비스를 우선으로 선정하게 됩니다.

빅데이터 플래그십 시범사업을 통해 성과를 이룬 사례가 있을까요?

◾ 지난 4년간 ‘빅데이터 플래그십 시범사업’에 총 27개의 기업이 참여하였고, 이들은 컨소시움을 구성하여 금융, 유통, 제조, 서비스 등 다양한 영역에서 많은 성과를 창출하였습니다. 대표적으로 2013년 KT의 이동통신망 데이터를 활용해 심야시간대 유동인구의 밀집도 등을 분석하여 이용객에 최적화된 서울시 심야버스 노선을 수립․적용하였고, 평균 2%의 승객 증가효과를 가져왔습니다. 작년에는 매일유업의 제조 생산·에너지 프로세스 효율화를 위한 빅데이터 활용 플랫폼을 개발하여 생산성 10% 향상, 불량률 30% 감소, 연 5.1억원 절감이라는 성과를 이루었습니다. 이 외 다양한 분야의 기업들이 많은 성과를 거두었으며, 빅데이터를 활용하여 성과창출을 이루기까지의 자세한 과정은 ‘빅데이터 활용 스마트서비스 우수사례집’에서 확인하실 수 있습니다.

빅데이터를 통해 실질적인 비즈니스 창출을 목표로 하는 기업들에게 조언을 한다면?

◾ 플래그십 시범사업은 많은 기업들이 향후 사업추진에 확대․적용할 수 있는 본보기로써, 빅데이터를 활용한 다양한 성공사례를 창출합니다. 4차산업혁명 시대를 맞아 기업들은 각자의 경쟁력 확보에 많은 노력을 기울이고 있습니다. 빅데이터를 통해 달성하고자 하는 성과를 명확히 이해하고, 이에 필요한 전문 기술의 파악과 전문 인력 확보 등으

로 어느때보다도 철저한 대비가 필요할 것입니다.

※ 빅데이터 활용 스마트서비스 우수

사례집은 빅데이터센터 홈페이지

(kbig.kr) 에서 확인하실 수 있습니다.

KBig Brief

빅데이터 선도 성공사례의 본보기, 빅데이터 플래그십 시범사업

http://kbig.kr


- 3 -

개요 ◾ 일시 : 2017. 8. 28. (월) ~ 8. 29. (화), 10:00~17:50

◾ 장소 : K-ICT 빅데이터센터 오픈랩(판교 스타트업캠퍼스)

◾ 참석대상 : 스타트업 및 중소기업, 예비창업자, 개발자 그룹, 대학(원) 등 24명

내용

◾ (1일차)

- (Track 1 : 분석기술) KBig 인프라 소개 및 사용 안내

- (Track 2 : 분석실습) Pig을 통한 빅데이터 분석 및 시각화

◾ (2일차)

- (Track 2 : 분석실습) Pig을 통한 빅데이터 분석 및 시각화- (Track 3 : 비식별 조치) 안전한 빅데이터 활용을 위한 분야별 개인정보 조치사항, 비식별

기술 및 실무 활용 사례, 실습 등

- (Track 4 : 빅데이터 세미나) 클라우드와 빅데이터 동향 및 사례

날짜 시 간 주요 내용 비고

1일차

Track 1 10:00～10:50(50분) - 센터 및 KBiG 분석툴 소개 NIA

Track 211:00～18:00(360분)

- Pig 소개 및 사용 방법

- 빅데이터 처리 기술 Pig 실습 CMI코리아

2일차

10:00～13:50(170분) - 데이터셋 분석 실습

Track 3 14:00～15:50(110분)- 국내 빅데이터산업 관련 정책 및

개인정보 비식별 처리 등 인하대

Track 4 16:00～18:00(120분) - 클라우드와 빅데이터 동향 및 사례삼양데이터

시스템

※ 상기 일정은 교육 상황에 따라 변동될 수 있습니다.

센터 주요뉴스

1. 빅데이터 분석 인프라 활용 교육 실시

예비창업·중소·대학(원) 등 빅데이터 센터 인프라 사용자 대상 인프라 내에서 Data 처리, 분석, 활용, 비식별 조치 안내, 빅데이터 세미나 등 관련 교육 진행


- 4 -

개요

◾ 일 시 : 2017. 8. 30. (수). 13:30~17:30

◾ 장 소 : K-ICT 빅데이터센터 오픈랩(판교 스타트업캠퍼스)

◾ 참석자 : 빅데이터 스타트업/중소기업, 예비창업자, 개발자 그룹, 대학(원)생 등 25명

주요내용

◾ 딥러닝 인프라(스파크R) 소개

◾ 딥러닝 기술 발전 트랜드 및 비즈니스 활용 방안

◾ 기계학습(Machine Learning)의 기초

◾ GPU 활용 신경망 및 딥러닝 기초

시 간 주요 내용 비고Track 1 13:30～13:50 20분 - 딥러닝 인프라(스파크R) 소개

Track 2 13:50～14:30 40분 - 딥러닝 기술 발전 트렌드 및 비즈니스 활용 방안송준호

수석

Track 3 14:30～15:50 80분

- 기계학습의 기초

· 선형회귀와 기계학습

· 기계학습을 위한 선형대수

· 다변량 선형회귀

송준이

팀장

휴 식

Track 4 16:00～17:30 90분

- GPU 활용 신경망 및 딥러닝 기초

· 신경망 기초

· 신경망의 학습 : 오차역전파방법

· 서포트 벡터 머신

· 무감독 학습

· GPU를 이용한 “MNIST” 실습

송준이

팀장


2. 딥러닝 인프라 이용 교육

최신 지능정보기술을 소개하고 빅데이터 분석·활용할 수 있는 기술 습득 및 빅데이터 딥러닝 지식 전반에 대해 이해


- 5 -

개요

◾ 일시 : 2017. 8. 31. (목) 9:00~17:50

◾ 장소 : K-ICT 빅데이터센터 오픈랩(판교 스타트업캠퍼스)

◾ 참석대상 : 스타트업 및 중소기업 개인정보 비식별 조치 실무자 등 참석

내용

◾ (기본과정)

- (비식별 조치 이론) 비식별 개념 및 비식별 개요/비식별 조치 가이드라인/비식별 조치 기술의 이해/Privacy Model이해 등

- (비식별 조치 기본실습) 비식별 도구(ARX)를 활용한 비식별 조치 실습으로 ARX 샘플 및 통신·금융 데이터 셋 비식별 기술 적용 방법 등

◾ (수료증발급) 기본/심화 교육과정을 이수한 수강생 대상 수료증 발급

시 간 주요 내용 비고

이론

09:00∼09:50 비식별 개념 및 비식별 개요

최재영교수

(성균관대)

10:00∼10:50 비식별 조치 가이드라인

11:00∼11:50 비식별 조치 기술의 이해

13:00∼13:50 Privacy Model의 이해

실습

14:00∼14:50 데이터 분석김승환교수

(인하대)15:00∼17:50비식별 실습

통신데이터를 활용한 실습


3. 비식별 조치 전문 교육 실시

기업의 안전한 빅데이터 활용을 위한 개인정보 비식별 조치 가이드라인 및 비식별 기술(이론·실습), 적정성 평가 등 기본·심화 과정 교육


- 6 -

빅데이터 센터 이용 교육

구분 1일차 2일차

주제 분석기술 분석실습 비식별 조치 교육 빅데이터 세미나

일시

8월28일(월) 8월29일(화)

9월20일(수) 9월21일(목)

10월19일(목) 10월20일(금)

11월16일(목) 11월17일(금)

12월14일(목) 12월15일(금)

※ 이용자 교육 세부 교육내용은 교육 시작 전 공지를 통해 안내 예정

비식별 조치 전문교육

구분 기본과정 심화과정

주제 비식별 조치 이론 비식별조치 기본 실습 비식별조치 심화 실습 적정성 평가 이론/실습

일시

8월31일(목)9월26일(월)

9월18일(월)

10월16일(월) 10월31일(화)

11월6일(월) 11월27일(월)

12월4일(월) 12월19일(화)

※ 기본과정 이수자에 한하여 심화과정 수강 가능

딥러닝 인프라 이용 교육

구분 딥러닝 교육

주제 딥러닝 인프라 소개 기술 트랜드 소개 기계학습의 기초 GPU활용 신경망 및 딥러닝 기초

일시

8월30일(수)9월22일(금)

10월 중순 예정11월 중순 예정12월 중순 예정

※ 10~12월 과정일자는 추후 업데이트 예정

※ 연간 교육 일정


- 7 -

새로운 과학의 한 분야 탄생 – 이미 놀라운 성과를 보이기 시작한 Data Science

◾ 데이터 과학은 빅데이터 기술과 보다 스마트한 방법을 사용하여 엄청난 양의 데이터를 분석하여 기업과 조직에 필요한 지식과 Insights를 추출하는 것이 핵심

- 빅데이터 분석을 통한 데이터 과학은 이전에는 없었던 새로운 과학 분야를 창출하고 있으며 이미 사회 과학 및 인문학 분야에 매우 큰 영향을 미치고 있음

- 모바일 센서, 정교한 센서, 웹 등의 데이터가 증가함에 따라 이러한 데이터 과학 분야의 확대 추세가 당분간 가속화 될 것으로 예상되며 업계에서는 의료 분야에서부터 미디어 분야에 이르기까지 모든 것을 개선하고 스마트화 하는 데이터 과학을 피부 깊숙이 느끼게 될 것으로 예측

Bigdata의 권력자 : Data Scientist의 미래 수요와 전망

Bigdata 전문 인력의 핵심 – Data Scientist의 성장세 확대, 부족 현상 심화분석 기술은 MapReduce, Pig, 기계 학습, Apache Hive 및 Apache Hadoop이 크게 각광향후 수요는 높지만 구하기는 어려운 전문 인력 – 데이터 사이언티스트, 데이터 엔지니어


- 8 -

- 데이터 과학은 필요한 지식으로의 접근과 발견을 위한 가장 강력하고 새로운 형태의 접근 방식을 제공하고 있으며 통계, 컴퓨터 과학, 응용 수학 및 시각화 측면을 결합하여 디지털 시대가 생성하는 막대한 양의 데이터를 새로운 통찰력과 새로운 지식으로 전환 할 수 있는 과학적 근거를 제공

미국의 Data Scientist 채용 건수 – 2020년에 272만 건으로 확대

◾ IBM은 2020년까지 미국의 모든 데이터 전문가의 채용 건수가 2015년 대비 36만 4,000 건이 증가하여 2,720,000건으로 확대될 것으로 예상

- 데이터 과학 및 분석 시장에서의 새로운 프로젝트는 15% 이상 확대될 것이며, 데이터 엔지니어 수요를 합하면 39%의 증가세를 보일 것으로 예측

- 데이터 과학 관련 전문 인력을 구하는데 기업들은 더 긴 시간을 할애할 것으로 예측되며, 관련 인력의 연봉은 8만 달러를 초과할 것으로 전망

- 데이터 과학 관련 전문 인력에 대한 채용 공고 또한 시장 평균값인 40일 보다 5일 더 길게 게시되고 있으며 평균 45일 동안 포스팅되어 있는 것으로 산출되고 있음

[The DSA(Data Science Analytics) Landscape]

[자료] IBM, Burning Glass Technologies 2017

DSA의 가장 큰 수요는 전문서비스 및 금융 분야

◾ 전문서비스 부문, 금융 및 보험, 제조, IT 산업에서 전체 수요의 상당 부분을 차지하고 있으며 분석관리자는 금융 및 보험 업계에서 가장 필요로 하고 있는 것으로 나타남


- 9 -

- 아래 표처럼 데이터 과학 분야 전문 인력은 금융 및 전문 서비스 산업이 주요 산업임을 보여주고 있으며 데이터 시스템 개발자는 전문서비스 부문에서, 분석 관리자는 금융 분야에서 가장 높은 수요를 나타냄

[Share of DSA Category Demand by Industry]


가장 수익성이 높은 분석 기술은 MapReduce, Pig, 기계 학습, Apache Hive 및 Apache Hadoop

◾ MapReduce 기술을 보유한 데이터 과학 및 분석 전문가는 연간 평균 115,907달러를 벌어들이고 있으며 조사에 따르면 가장 수요가 많은 기술로 평가받고 있음

- Pig, Apache Hive 및 Hadoop 전문 지식을 보유한 데이터 과학 및 분석 전문가는 $ 100K 이상을 지불하는 직업을 놓고 경쟁하고 있는 수준으로 최근 데이터 과학자의 몸값은 지속적으로 확대되는 양상

- 그 외에도 빅데이터 기본 기술, 데이터사이언스, NoSQL, 몽고DB 등의 전문 인력 또한 대부분 10만 달러 이상의 연봉을 확보하고 있는 것으로 나타남


- 10 -

[Highest Paying Analytical Skills (with at Least 7,500 Postings)]


최근 5년간 가장 높은 성장세를 보인 전문 인력 분야 – 데이터 사이언티스트

◾ 구인 분석을 통해 살펴본 최근 5년간 데이터 사이언티스트의 성장세는 28%로 다른 분야를 압도하고 있으며 2020년에는 6만 건을 넘어설 것으로 예측

- 여전히 데이터 기반 의사결정 분야, 기능기반 분석, 데이터 시스템 개발자의 구인 분야가 높은 비중을 보이고 있으나 데이터 사이언티스트 분야의 성장세보다는 다소 낮은 것으로 평가

- 데이터 사이언티스트 및 분석 전문가는 10만 달러 내외의 연봉을 기록할 것으로 전망되며 DSA 분야 전문 인력 확보는 수요 기업에게 쉽지 않은 분야가 될 것으로 예측

[Summary Demand Statistics]



- 11 -

Analytics Manager급 전문 인력을 채용하는데 가장 긴 시간 소요 - 53일

◾ Analytics Manager 전문 인력을 확보하는 시간으로 평균 53일이 걸리므로 관련 직종 중 가장 확보하기 어려운 것으로 평가

- 금융 분야의 데이터 과학 및 분석 전문가를 찾는 것은 상대적으로 난이도가 낮은 편이지만 적어도 35일 이상의 시간이 소요되는 것으로 나타남. 아래 표는 산업별 직종, 직위의 전문인력을 확보하는데 걸리는 평균 시간 및 평균 연봉을 제시한 표

[인력 채용에 걸리는 시간 – 주요 산업별]


DSA 분야 전문 인력의 보유 기술 조건 – SQL 및 데이터 분석 기술

◾ 여전히 SQL 및 데이터 분석 분야 인력을 확보하려는 기업의 비중이 가장 높게 나타나고 있으며 금융 분야 분석가 및 데이터 관리 분야 인력 또한 수요가 높게 나타나고 있는 것으로 조사됨

- 또한 최근 성장세가 급등하고 있는 기술 분야로는 데이터 사이언스 분야 및 기계 학습 분야로 최근 2년간 각각 93%, 56%의 성장세를 보이면서 각광받는 분야로 떠오름


- 12 -

[ 최상위 분석 기술 종류 및 성장세가 높은 기술 분야]


수요는 높고 구하기는 어려운 전문 인력 부문 – 데이터사이언티스트, 데이터 엔지니어

◾ DSA 분야 전문 인력을 Matrix로 표현했을 때 관련 분야 수요가 높고 구하기는 어려운 분야는 5가지로 나타남 – Data Scientist, Data Engineer, Director of Analytics, BI Architect, System Analyst

- 관련 수요가 높아도 HR, 금융전문가, 마켓리서치, 통계전문가, BI분석, 비즈니스 관리 분석가 분야는 인력 확보 난이도가 상대적으로 낮은 편으로 평가됨

[DSA Jobs Matrix]



- 13 -

◾ 기술 및 Skill 분야에서는 관계형 DBMS, SQL, 데이터 마이닝 분야는 성장세가 높지 않은

분야로 나타나고 있는 반면 기계학습, 빅데이터, 데이터사이언스, 데이터 시각화, R, 아파치 하둡, 데이터 엔지니어링 분야는 성장세가 상대적으로 큰 것으로 나타나고 있음

- 특히 데이터 사이언스, 빅데이터 아파치 하둡, 기계학습 등의 수요는 성장세뿐만 아니라 10,000명 이상의 전문 인력 수요가 나타나고 있어 인력 부족 현상이 나타남

[DSA Skills Matrix]


[TOP 10 기술 분야 직종 - 2017]

[자료] Robert Half Technology 2017


- 14 -

요약 및 결론

◾ 데이터 과학 부문은 엄청난 양의 데이터를 분석하여 기업과 조직에 필요한 지식과 Insights를 추출하는 것이 핵심 - 빅데이터 활용이 일반화되고 있는 현 시점에서 가장 중요한 인력으로 평가되고 있으며 향후에도 지속적인 인력 수요가 발생할 것으로 전망

◾ IBM은 2020년까지 미국의 모든 데이터 전문가의 채용 건수가 2015년 대비 36만 4,000 건이 증가하여 2,720,000건으로 확대될 것으로 예상

◾ MapReduce 기술을 보유한 데이터 과학 및 분석 전문가는 연간 평균 115,907 달러를 벌어들이고 있으며 조사에 따르면 가장 수요가 많은 기술로 평가받고 있음

◾ 구인 분석을 통해 살펴본 최근 5년간 데이터 사이언티스트의 성장세는 28%로 다른 분야를 압도하고 있으며 2020년에는 6만 건을 넘어설 것으로 예측

◾ Analytics Manager 전문 인력을 확보하는 시간으로 평균 53일이 걸리므로 관련 직종 중 가장 확보하기 어려운 것으로 평가

◾ 여전히 SQL 및 데이터 분석 분야 인력을 확보하려는 기업의 비중이 가장 높게 나타나고 있으며 금융 분야 분석가 및 데이터 관리 분야 인력 또한 수요가 높게 나타나고 있는 것으로 조사됨

◾ DSA 분야 전문 인력을 Matrix로 표현했을 때 관련 분야 수요가 높고 구하기는 어려운 분야는 5가지로 나타남 – Data Scientist, Data Engineer, Director of Analytics, BI Architect, System Analyst

1. IBM, Burning Glass Technologies 2017

2. Robert Half Technologies 2017

3. Forbes 20174. http://www.rht.com

[출처]


- 15 -

국내 활용 동향

남양주시, 빅데이터 활용한 ‘불법 주정차 다발지역 지도’ 제작

◾ 경기 남양주시가 최근 3년간 주정차 단속 자료를 빅데이터 분석하여 ‘불법 주정차 다발지역 지도’를 제작. 이를 활용하여 불법 주ㆍ정차에 대한 계도와 단속을 선제적으로 실시, 향후 고정형 주정차 단속 CCTV 신규 설치 및 이전 장소 결정에 근거자료로 활용 예정

..................................................................................................................................................................................

한국과학기술원(KAIST), ‘응용 프로그래밍 인터페이스(API)’ 개발

◾ 한국과학기술원은 사회관계망서비스(SNS)를 분석해 개인에게 맞춤형 장소를 추천해주는 응용 프로그래밍 인터페이스(API)를 개발. ‘딥러닝’(Deep Learning)을 이용하여 사진을 분석한 뒤 ‘텍스트 마이닝’ 기법을 이용해 글을 분석, 사진의 의미를 추출하는 원리를 활용. 현재 서울지역을 대상으로 시범적용 중이며, 다른 지역으로도 확대할 예정

..................................................................................................................................................................................

시스메틱, 빅데이터 분석 시스템 개발

◾ 시스메틱은 증권사의 PB와 일반 투자가들과의 온라인 매칭을 통해, 투자 상담 전문가를 찾는 일반인들도 증권사 지점에 직접 방문하지 않고 온라인상에서 PB를 찾아 상담이 가능한 플랫폼 개발에 착수. 향후에는 AI 기반 시그널서비스 빅데이터 분석 시스템도 개발 예정

..................................................................................................................................................................................

성동구, 어린이 안전지도 표준모델 구축으로 안전사고 선제적 대응

◾ 성동구는 교통사고데이터 6300건 외 19여종의 공공데이터를 확보하여, 어린이 교통사고 및 안전사고 빅데이터 자료 분석을 실시. 성동구 어린이 안전 취약요소 분석모델을 개발하고 이를 반영한 ‘성동구 어린이 안전지도 표준모델’을 제작할 예정

..................................................................................................................................................................................

한국과학기술원 신약개발을 위한 빅데이터 기반 가상인체모델 개발

◾ 한국과학기술원 이도헌 교수 연구팀은 2600만여개의 빅데이터를 활용해 인체 내 조직, 세포들의 다양한 상호작용으로 구성된 가상인체시스템을 구축. 이 시스템을 활용해 약물과 질병 사이의 네트워크 경로를 분석, 약물의 작용 기전과 부작용 예측에 기여할 것으로 기대

http://www.asiatoday.co.kr/view.php?key=20170808010003642

http://www.sciencetimes.co.kr/?news=%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A1%9C-%EB%A7%9E%EC%B6%A4%ED%98%95-%EC%9E%A5%EC%86%8C-%EC%B0%BE%EC%95%84%EC%A4%80%EB%8B%A4

http://news.joins.com/article/21871117

http://www.asiae.co.kr/news/view.htm?idxno=2017082907150032702

http://www.irobotnews.com/news/articleView.html?idxno=11385


- 16 -

국내 빅데이터 기업

기업 소개

◾ '캐치댓글'과 '미디어렌즈'를 통해 브랜드를 관리하고 타겟 마케팅을 수행하고, 'AI 챗봇'을 통해 로봇 기반의 자동 응답 상담을 지원하고 대화창에서 서비스를 제공

주요 분석 서비스

◾ 자연어 처리 기술 : 자연어 형태소 사전 구축하고 있으며 기계 학습을 통한 신조어들을 보유. 확률 기반 감성 분석, 조건부 기반 형태소 분석 기술을 통해 자연어 분석 수행

◾ 데이터 마이닝 : 유사 패턴 매칭을 통해 주요 정보를 군집화하고 추출. 주제어 추출, 연관 키워드, 서술어 추출 등을 이용하여 데이터를 분류하고 정제

◾ 지표 기반 보고서 생성 : 브랜드 상태를 요약할 수 있는 각종 지표 기반의 보고서를 자동 생성하여 인사이트를 제공. 보유한 데이터를 기업이 원하는 다양한 차원으로 나누어 분석하고 시각화된 결과를 고객에게 전달

기업 소개

◾ WORLDWIDE WISEnut 비전과 Market Creation, Diverse Products, Go global의 전략을 바탕으로 국내시장을 공고히하고, 더 넓은 세계시장으로 활동무대를 넓혀나가고 있는 검색기술기반 빅데이터 전문기업

주요 분석 서비스

◾ 화제어/연관어 분석 : 형태소분석 기술 보유. 단어의 언급 빈도 및 상호 연관도 등의 분석을 통해 화제어 추출 및 워드클라우드, 의미망분석 제공

◾ 감성분석 : 의미기반의 패턴분석 기술 보유. 감성과 심도 분석◾ 점유율분석 : 키워드별/채널별 버즈량의 통계 제공◾ 대시보드 : 통계데이터 및 RAW데이터를 모두 확인할 수 있는 시각화 대시보드 제공◾ 리포팅 : 간략한 통계리포트부터 이슈/시사점/인사이트 등을 포함한 심층 리포트까지 고객 맞춤 제공

“리비는 플랫폼을 통해 사람과 양질의 정보를 연결시키고자 합니다.”

“정보유통혁명을 이끌며 기업용 인공지능 SW시장을 선도하는 퍼스트 무버”


- 17 -

빅데이터를 통해 본 키워드, “계란”

Trend

* 2017년 7월 26일~2017년 8월25일 동안 ‘계란’ 키워드를 분석한 결과입니다.(뉴스 / 블로그)

‘계란’ 키워드 트렌드 분석결과 ◾ ‘계란’에 대한 트렌드 분석 결과, 계란 살충제 이슈가 발생한 8월 초부터 언급량이 증가하는 모습을

보이며, 8월 중순 ‘계란’에 대한 관심이 크게 증가

연관토픽 감성분석

‘계란’ 키워드 연관토픽 및 감성 분석결과 ◾ 주로 ‘살충제 성분’, ‘피프로닐’, ‘전수조사’, ‘불안감’ 등이 ‘계란’과 함께 언급되며, 식약처의 발표

결과와 관련 키워드가 다수 언급

◾ 긍부정 분석결과 ‘계란’ 키워드는 ‘검출’, ‘사태’, ‘논란’, ‘불안’ 등 계란 안전성 우려에 관한 부정적인 감성어들이 70% 이상 차지


- 18 -

“Data Technology 그리고 사람, 그 너머까지 고민합니다.” 초록소프트(주), 고객성향 파악 및 미래행동 예측 빅데이터 플랫폼을 통한 데이터 처리, 분석 제시

‘초록소프트’가 추구하는 세상

◾기존의 상권분석은, 매출, 개폐업률, 임대료 등 결과값 도출에 집중하지만, 저희 초록소프트(주)는 상권의 유동인구 소비자들이 무엇을 원하고, 어떤 경로를 거치고, 어느 공간에 머물며, 손님인지를 예측해주는 서비스입니다. 초록소프트(주)는 인간의 판단이 개입된 information 시대를 넘어, 데이터 그 자체가 모든 것을 말하고 새로운 판단기준이 되는 데이터 시대의 비전을 조금씩 증명하고 싶습니다.

어떤 서비스를 제공하고 있나요?

◾ 기존 고객행동분석은 단말기를 실내에 설치하여, 고객을 인식하고 행동패턴을 알려주는 것으로 단말기 설치 및 유지비용 발생과 매장 입구나 매장 안의 유동인구만 분석 가능하지만 저희가 제공하는 서비스는 모바일 이용자가 이동, 체류하는 모든 지역에서, 유동인구 정보를 실시간 파악할 수 있어 자영업을 준비 중인 분들에게 유용합니다.

또한, 이화여대와 함께 ‘유동인구정보’와 ‘기상정보’를 결합해 재해, ․재난 예측을 해주는 프로젝트 ‘레인버드지오’ 파일럿 버전을 선보였고, 내가 선택한 선수들의 실시간 실황을 보며 모바일과 연동해 점수화하고, 유저들과 경쟁하는 ‘스포츠빅데이터 분석형 야구게임’인 Draft Dna를 개발했습니다.

앞으로 초록소프트의 행보는?

◾ 초록소프트(주)는, 곧 데이터제공업체 (주)saltrux와 협력해 sns상의 원하는 실시간 데이터와 실시간 GPS경로데이터 등을 제공받게 됩니다. 이를 통해 입점객수 예측의 정확성을 높이고, 입점객수를 바탕으로 한 권리금적절성검토를 진행할 예정입니다.

Bigdata Deep Learning 분석 결과의 모바일 앱 제공

▶ 2015년 7월 법인설립▶ 정보통신기술진흥센터 ICT유망기술개발지원사업 선정▶ 대한민국발명특허대전 한국특허정보원장상 수상▶ K-Global 300 ICT 유망기업 선정▶ 신규매장 손님수 예측 서비스 '요목조목' 모바일 앱 개발▶ Fantasy Baseball Game DrfatDNA( www.draftdna.com ) 모바일 앱 개발


- 19 -

9월 SEP

SUNDAY MONDAY TUESDAY WEDNESDAY THURSDAY FRIDAY SATURDAY

1 2 3 1 2

3 4 5 6 7

■ 글로벌 데이터톤

아이디어 접수 마감

8

■ 빅데이터 스타트업

및 오픈랩 파트너

(BOLP) 신청 접수마감

9

10 11 12 13 14 15 16

17 18

■ 빅데이터센터


19 20


인프라 이용 교육

21


인프라 이용 교육

22


딥러닝 교육

23

24 25 26



27 28 29 30

빅데이터 지식자료 안내

분석/교육/개발/딥러닝 인프라 NIADic(형태소사전) DataCube(800여종 data) 비식별조치 지원(적정성평가/컨설팅)

* KBig 홈페이지(kbig.kr)에서 확인하실 수 있습니다

Documents

Bigdata Monthly Vol 32. August 2017 · 1일차 Track 110:00～10:50(50분)- 센터 및 KBiG 분석툴 소개 NIA Track 2 11:00～18:00(360분) - Pig 소개 및 사용 방법 - 빅데이터