68
2017. 11. 13 리서치센터 이학무 02-3774-1785 hmlee@ 도현우 02-3774-3803 hwdoh@ 문지현 02-3774-1640 jeehyun.moon@ 박정엽 02-3774-1652 jay.park@ 정용제 02-3774-1938 yongjei.jeong@ 하누리 02-3774-1653 nuri.ha@ @miraeasset.com 인공지능 기술 적용으로 음성 인식률 상승하면서 음성 인터페이스 시대 도래 음성 인터페이스는 핵심 단말인 음성 인식 스피커에 탑재되어 사물인터넷 시대 본격화할 전망 음성 인터페이스 시대의 주된 경쟁 요인은 1) 높은 음성 인식률로서 데이터 보유량이 관건 2) 사물인터넷 기기 연동, 커머스, 콘텐츠 등 다양한 서비스로의 확장 지원 또한 필요 음성 인터페이스 시대 Voice Revolution

[The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

2017. 11. 13

리서치센터

이학무 02-3774-1785 hmlee@ 도현우 02-3774-3803 hwdoh@ 문지현 02-3774-1640 jeehyun.moon@ 박정엽 02-3774-1652 jay.park@ 정용제 02-3774-1938 yongjei.jeong@ 하누리 02-3774-1653 nuri.ha@ @miraeasset.com

인공지능 기술 적용으로 음성 인식률 상승하면서 음성 인터페이스 시대 도래

음성 인터페이스는 핵심 단말인 음성 인식 스피커에 탑재되어 사물인터넷 시대 본격화할 전망

음성 인터페이스 시대의 주된 경쟁 요인은 1) 높은 음성 인식률로서 데이터 보유량이 관건

2) 사물인터넷 기기 연동, 커머스, 콘텐츠 등 다양한 서비스로의 확장 지원 또한 필요

음성 인터페이스 시대

Voice Revolution

Page 2: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

2 Mirae Asset Daewoo Research

C O N T E N T S

I. 음성 인터페이스 시대 6

1. 음성 인터페이스의 도입 6

2. 음성 인터페이스의 단계 8

3. 하드웨어의 발전 및 빅데이터의 형성을 통한 음성 입력 시장 개화 9

4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도 증대 11

5. 음성 인식 스피커는 음성 인터페이스 시장의 핵심 단말 13

II. 사물인터넷 성장 본격화 17

1. 사물인터넷 시장을 여는 인터페이스 변화에 주목 17

2. 사물인터넷의 보급 과정은 앞선 인터넷 시대와 상이할 전망 18

3. 사물인터넷 전용 통신망 활용 필요 19

4. 홈 플랫폼의 확장 차량 20

5. 홈 플랫폼의 진화 커머스 및 콘텐츠 21

III. 인터넷 플랫폼의 진화 22

1. 음성 인식을 통해 확대되는 플랫폼 지배력 22

2. 인공지능 스피커의 대중화 24

3. 음성 커머스 시대의 개화 26

4. 인터넷 엔진은 '검색'에서 '추천'으로 전환 28

5. 플랫폼으로서의 자동차 부각 29

IV. 콘텐츠 산업의 확대 31

1. 음성 인식을 통해 확대되는 콘텐츠 소비 31

2. 음성 인식은 3가지 미디어 트렌드를 강화 33

3. 콘텐츠 제작 역량 부각 37

Top Picks 및 관심종목 39

NAVER (035420) 40

SK텔레콤 (017670) 44

LG유플러스 (032640) 51

로엔 (016170) 55

CJ E&M (130960) 59

알파벳 Alphabet (GOOGL US) 64

아마존 Amazon (AMZN US) 66

Page 3: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 3

Voice Revolution

인공지능의 발달로 음성 인터페이스 시대 도래

헤테로지니어스 컴퓨팅의 본격적인 적용과 빅데이터를 적극 활용한 인공지능의 발달로 음성 인식

률이 의미 있는 수준으로 상승하면서 음성 인터페이스 시대가 열리고 있다. 새로운 인터페이스의

도입은 항상 새로운 시대를 열었던 것에 주목해야 한다. 키보드와 마우스로 조합된 인터페이스의

탄생으로 유선인터넷 시대가 열렸고 터치 인터페이스 도입으로 무선인터넷 시대가 도래했다. 이제

는 ‘음성’ 인터페이스를 통해 ‘사물인터넷’ 시대가 열리게 될 것이다.

음성 인터페이스의 핵심 단말은 음성 인식 스피커가 담당하게 될 것이다. 음성 인식 기능을 각각의

기기에 개별적으로 장착하기 보다는 하나의 독립적인 단말에 탑재할 필요가 있다. 사물인터넷, 커

머스, 콘텐츠 등으로 음성 인식 스피커의 사용 영역이 확장되면 소비자와 서비스를 잇는 매개체 역

할의 홈 플랫폼으로 발전할 가능성이 높기 때문이다.

음성 인터페이스 시대에서 가장 많은 수혜가 예상되는 기업은 대규모의 데이터 베이스에 기반하여

높은 음성 인식률을 달성할 수 있는 알파벳과 클라우드 및 전자상거래 시장에서 강한 영향력을 발

휘하고 있는 아마존이다. 국내에서는 한국어 인식률 제고에 좋은 여건을 가지고 있는 NAVER와

음성 인식 애플리케이션을 초기에 공급할 수 있는 SK텔레콤 및 LG유플러스 등이 있다.

인터넷 기업에게 음성 인터페이스는 새로운 성장 기회

음성 인터페이스가 도입되면서 인터넷 기업은 새로운 영역으로의 사업 확장을 통한 추가적인 성장

이 가능할 전망이다. 음성 인터페이스는 인터넷 기업이 사업 영역을 PC와 모바일을 넘어 오프라인

과 주행 중인 자동차로의 성공적인 확장을 도와주는 핵심적인 역할을 할 것이다.

인터넷 플랫폼의 작동 엔진은 검색 및 노출 메커니즘에서 추천 및 큐레이션 메커니즘으로 점차 전

환될 것으로 예상된다. 이는 검색광고에 잠재적인 위협이 될 수도 있다. 그러나 인터넷 기업들은

음성과 시각 인터페이스의 결합, 최종 액션에 해당하는 커머스 및 결제 기능 강화 등으로 대응하고

있다. 음성 인터페이스 시대에는 인터넷 기업들 간의 서비스 품질에 따른 매출 격차도 가속화될 것

이다. 결국 음성 인식 플랫폼 및 기기에 탑재된 인공지능 엔진의 정교함이 더욱 중요해질 것이다.

콘텐츠 중심의 미디어 방향성을 가속화 시킬 음성 인터페이스

음성 인터페이스 도입 시 TV, 모바일 등 콘텐츠 이용 기기 조작이 크게 편리해질 전망이다. 기존

입력 방식(리모콘 입력, 액정 터치 등)보다 조작 횟수를 줄여 주는 한편 ‘핸즈프리’를 보편화해 전

체 미디어 콘텐츠 가용 시간도 증가 시킬 것이다. 이를 통해 자유소비재인 콘텐츠에 대한 전체 소

비량이 증가할 가능성이 높다. 미디어 이용 증가는 과거 PC와 모바일 출현 때도 경험했던 일이다.

한편 기존의 미디어 변화 흐름이 더욱 빨라질 것으로 본다. 1) 유료 판매 상품으로서 콘텐츠의 가

치가 부각될 전망이다. VoD 및 음원 서비스 이용이 증가해 광고 판매로 콘텐츠 수익 모델 이동

도 가속될 가능성이 높다. 2) 다양한 플랫폼에 대한 접근성이 골고루 높아질 수 있다. 이에 따라

TV 채널 등 기존 전통 플랫폼 의존도가 줄어들고, 상대적으로 비주류였던 콘텐츠 장르(니치 콘텐

츠; MCN, 보이스 등)가 조명 받을 여지가 크다. 접근성보다 콘텐츠 경쟁력이 중요해지는 것이다.

이에 따라 콘텐츠 브랜드 가치가 재평가될 것이다. 이는 데이터 분석에 기반한 콘텐츠 기획에도 중

요한 요소다. 콘텐츠 경쟁력, 브랜드 가치를 겸비한 대형 사업자(CJ E&M)에 주목이 필요하다.

Summary

Page 4: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

4 Mirae Asset Daewoo Research

하드웨어별 인터페이스의 변화

자료: 미래에셋대우 리서치센터

인터넷별 발전 단계 도식

자료: 미래에셋대우 리서치센터

음성 인식과 인공지능의 도입으로 검색 외에 ‘추천’ 인공지능 엔진의 중요성 증대

자료: 미래에셋대우 리서치센터

<입력>

텍스트

이미지

오디오

자연어

음성

대화

시스템

검색

정답/추천

엔진

정보

소통

쇼핑

<출력>

텍스트

이미지

음성

오디오

비디오

인공지능 영역

Page 5: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 5

인공지능 탑재된 음성 인식 스피커를 통한 상품 주문 및 음성 결제 보편화 추세 전망

주: 미국 성인 조사 기준

자료: BI Intelligence, 미래에셋대우 리서치센터

음성 인식은 편리한 조작 & 기기 연결 지원, 이를 통해 콘텐츠 소비 자극 & 이용 패턴 다양화 예상

자료: 미래에셋대우 리서치센터

스피커로 콘텐츠 이용 시 입력 횟수는 눈에 띄게 감소 모바일 등장 편의성 개선 시에도 미디어 소비 시간 증가

자료: 미래에셋대우 리서치센터 자료: eMarketer, PEW Research, 미래에셋대우 리서치센터

0

10

20

30

40

0

20

40

60

80

100

2017 2018F 2019F 2020F 2021F 2022F

(%)(백만명)

음성 결제 이용자 수 (L)

음성 결제 이용자 비율 (R)

0

5

10

15

20

25

30

아이폰 터치 올레tv

리모컨

Nugu

스피커

아이폰 터치 PC 마우스,

키보드

Nugu

스피커

VoD 음원

(회)

VoD와 음원 재생을 위한

입력 횟수는

음성 인식 스피커에서

월등히 작음

350

450

550

650

750

2008 2011 2016

기타 인터넷 디바이스

PC

모바일

전통매체

(분) 2016년 미디어 소비 시간은

2008년 대비 +14%

Page 6: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

6 Mirae Asset Daewoo Research

I. 음성 인터페이스 시대

1. 음성 인터페이스의 도입

음성 기반의 인터페이스 시대가 열리고 있다. 음성 인터페이스는 1) 사물인터넷 도입을 가속화 시킬

것이고, 2) 편의성 증대를 통해 전자상거래 시장 성장을 견인할 것이며, 3) 콘텐츠 검색이 용이해지면서

음악 및 영상 콘텐츠 수요 증가에 기여할 것이다.

음성 인터페이스는 이미 스마트폰에 널리 적용되어 있지만 사용률이 현저히 낮다. 이는 1) 스마트

폰에 음성으로 입력하는 것은 사생활 보호가 어렵고, 2) 노이즈가 많아서 인식률이 떨어질 뿐만 아

니라, 3) 음성 인터페이스가 주는 추가적인 가치가 제한적이기 때문이다.

이와 같은 요인을 감안하면 음성 인터페이스는 사생활이 보호될 수 있고, 노이즈가 낮은 환경인 가

정 또는 차량에서 활용도가 높을 것이다. 특히 음성 인식 기능이 사물인터넷의 입력 장치로 활용되

면 소비자에게 차별화된 가치를 부여할 수 있어 홈 IoT 또는 차량용 IoT 시장 중심의 성장이 기대

된다.

음성 인터페이스 시대의 주요 단말은 음성 인식 스피커가 될 것으로 예상한다. 다수의 IT 업체가

인공지능 스피커를 출시하는 것도 이의 일환으로 해석할 수 있다. 가정 내에서 컨트롤 할 수 있도

록 에어컨, 보일러, 전등 등 다양한 기기들과의 연결이 필요하다. 추가적으로 커머스, 콘텐츠 등의

영역에서 기존과 다른 편리성을 제공해 주어야 할 것이다.

그림 1. 음성 인터페이스의 주요 3대 활용 영역: 1) 사물인터넷, 2) 커머스, 3) 콘텐츠

자료: 미래에셋대우 리서치센터

Page 7: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 7

음성 인터페이스 기반의 플랫폼 시장을 선점하기 위해서 가장 중요한 것은 음성 인식률이다. 음성 인식

률에 주요한 영향을 미치는 요소는 알고리즘과 하드웨어 그리고 이를 보완하기 위한 데이터 베이

스이다. 음성 인식의 경쟁력은 데이터 보유량에 달려있다. 알고리즘과 하드웨어 구축 기술은 이미 성

숙되어 있어 선두 업체간의 차별성은 크지 않기 때문이다. 이에 검색 엔진을 통해 방대한 데이터를

축적하고 있는 인터넷 업체가 가장 유리해 보인다.

음성 인식률만큼 중요한 것은 음성 인터페이스에 적합한 핵심 서비스를 제공할 수 있는 지에 대한

여부이다. 핵심 서비스로 고려할 수 있는 것이 커머스와 미디어 콘텐츠 영역인데 여기서도 주요한

차별화는 데이터 보유량에서 비롯된다. 음성을 통해 필요한 물건이나 원하는 콘텐츠를 검색해서

구입하는 것은 화면을 통해 이미지로 보여주는 것보다 훨씬 더 제약이 높다. 따라서 축적된 데이터

에 기반하여 소비자별로 선호에 맞는 소수의 제품 및 콘텐츠를 추천하고 이 중에서 고르도록 해야

편리함을 느낄 것이다.

‘추천’에서 가장 경쟁력 있는 업체는 단연 아마존과 넷플릭스다. 자체 플랫폼을 통해 축적된 소비자

경험을 기반으로 소비자 취향을 고려한 맞춤형 제품 또는 콘텐츠를 적절하게 추천하고 있다. 최근

에는 고객 데이터를 기반으로 새로운 비즈니스 모델을 구축한 미국 온라인 쇼핑 업체 Stitch Fix가

화두이다. 아마존이나 넷플릭스가 추천에 있어 오랜 기간 동안 축적해 온 데이터를 활용하는 반면

Stitch Fix는 10가지의 기본적인 질문을 통해 즉각적으로 고객의 선호를 파악한다. 이후 전문 스타

일리스트가 고객 맞춤형 옷을 선택하여 배송한다. 이후 소비자의 구매 여부를 다시 반영하면서 고

객의 선호도 파악을 위한 데이터를 더욱 정교화 시킬 수 있다. 이처럼 고객 데이터를 초기에 확보

할 수 있는 알고리즘을 갖춘 업체가 음성 인터페이스 시대의 승자가 될 수 있을 것이다.

표 1. Stitch fix의 서비스 프로세스

주체 내용

소비자 1) 사이트 접속 후 스타일 프로필 작성

- 신체치수/스타일 선호/라이프스타일/스타일 샘플 선호 체크

소비자 2) 희망 배송 날짜 선택

소비자 3) 스타일링 비용 US$20 지불 (향후 상품 구매 시 환불 가능)

사업자 4) AI가 1차 스타일 추천

사업자 5) 전문 스타일리스트가 5가지를 골라 배송

소비자 6) 배송된 5가지 옷 중 마음에 드는 옷은 결제하고 나머지는 반품

자료: Stitch fix, 미래에셋대우 리서치센터

그림 2. 아마존의 상품 추천 표시 화면 그림 3. 넷플릭스의 콘텐츠 추천 표시 화면

자료: 아마존, 미래에셋대우 리서치센터 자료: 넷플릭스, 미래에셋대우 리서치센터

Page 8: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

8 Mirae Asset Daewoo Research

2. 음성 인터페이스의 단계

인터페이스로서의 음성 인식은 3가지 단계로 나눌 수 있다. 1단계(Single Turn)는 단순한 명령을

하나씩 인식하고 수행하는 단계이다. “음악 틀어줘” 및 “TV 켜줘”와 같은 명령들이 이에 해당한다.

2단계(Multi Turn)는 대화를 통해서 연속된 명령을 수행하는 것이다. 소비자의 명령으로 TV가 켜

지면 인공지능이 “어떤 채널로 이동할까요?”라는 질문을 하고, 다시 소비자가 “뉴스 채널 틀어줘”

라고 명령한다. 첫 명령에서 다음 명령이 필요한지를 인지하고 다음 명령을 위한 적절한 질문을 이

어가는 단계인 것이다. 추가 명령 필요에 대한 파악을 위한 기술력이 아직은 완전하지 않아 서비스

업체가 모든 경우의 상황을 가정하여 사전에 필요한 입력을 해주는 방식으로의 대응이 필요하다.

현재 1~2단계까지의 상용화 기술은 선두 업체가 거의 확보하고 있는 것으로 파악된다.

3단계(Multi Intent)는 2개 이상의 서술어를 동시에 인식해서 수행하는 것이다. “TV 켜주고, 채널

은 뉴스 채널로 틀어줘”라는 복합 명령을 한번에 인식해서 TV를 켜고 원하는 채널로 이동시켜 준

다. 이 단계가 되어야 비로서 소비자는 불편함을 느끼지 않는 단계 즉, 인공지능에 소비자가 적응

할 필요가 없는 단계에 도달하게 되는 것이다.

표 2. 음성 인식의 3단계

단계 기능 내용

1단계 Single Turn 단순 명령 인식 및 수행

예) TV 전원을 켜는 수준

2단계 Multi Turn 대화를 통해 연속된 명령 수행

예) 1차 명령으로 TV 전원을 켠 후 2차 명령에 의해 원하는 채널로 이동하는 수준

3단계 Multi Intent 복합적인 명령을 동시에 인식 및 수행

예) 복합 명령을 일시 인식 후 TV 전원을 켜고 원하는 채널로 이동

자료: 미래에셋대우 리서치센터

음성 인식을 보안 수단으로 활용하거나 여러 사람의 목소리를 분간하여 다양한 서비스에 적용하는 것이

음성 인터페이스 기반의 서비스 완성도 및 소비자 만족도 측면에서 더욱 중요할 수 있다. 음성을 통한

인증이 가능하게 되면 전자상거래에서 결재 시 목소리로 1차 인증을 하고, 비밀번호 입력 정도로

결재가 완료되도록 지원할 수 있어 쇼핑의 편리함이 높아지게 된다. 실제로 음성 인증은 인프라로

마이크만 있으면 되기 때문에 주요 생체 인증 방식인 지문, 홍채, 음성 중 편의성 측면에서 가장

부각되고 있다.

사람의 목소리는 억양과 발음이 모두 다르고 후두, 비강, 성대의 모양에 따라 고유의 패턴을 나타

낸다. 누군가의 목소리를 다른 사람이 재현하는 것은 거의 불가능할 뿐만 아니라 실제 사람이 내는

소리와 그 소리를 녹음해서 스피커에서 출력되는 소리는 전혀 다른 성질을 보인다. 심지어 감기 등

으로 목소리가 달라져도 억양과 목소리의 속성은 변하지 않기 때문에 시스템이 목소리의 주인을

음성으로 인식하는 것은 충분히 가능하다.

이미 해외에선 바클레이즈와 HSBC 등이 음성 인증을 거래에 사용하고 있으며, 국내에서는 국민

은행과 BC카드가 음성 인증 서비스를 시작했다. 삼성전자 또한 자사 인공지능 플랫폼인 빅스비에

음성 인증 기능을 탑재해 간편 결제 서비스 삼성페이와 접목하여 금융 플랫폼의 역할을 강화할 예

정이다. 음성 인터페이스에 음성 인증이 완전 도입되는 것은 그리 오래 걸리지 않을 것으로 본다.

같은 기술을 다른 측면으로 적용하면 가족들의 음성을 다 따로따로 인지해서 “내 방에 불 켜줘” 또

는 “내가 좋아하는 피자 시켜줘”라는 명령에 해당 명령을 내린 사람의 방의 불을 켜주거나 그 사람

이 좋아하는 피자를 주문해 주는 것이 가능해 질 것이다. 이러한 서비스가 안정적으로 제공된다면

음성으로 인터페이스를 바꾸는 충분한 유인이 될 수 있다고 판단한다.

Page 9: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 9

3. 하드웨어의 발전 및 빅데이터의 형성을 통한 음성 입력 시장 개화

음성으로 입력하기 위해서는 음성을 정확하게 인식하는 것이 필수적이다. 음성 인식은 매우 오래된

연구 분야이다. 2011년 아이폰4S 시리즈부터 탑재되기 시작한 애플의 시리처럼 음성 인식의 상용

화는 이미 오래 전부터 이루어져 왔다. 하지만 인식의 정확도가 낮아 대중화되었다고 표현하기는

아직 이르다. 개발자 입장에서는 10%의 오류가 있으면 인식률이 90%로 높다고 생각할 수 있지만,

소비자 입장에서는 10번에 1번을 알아듣지 못하면 해당 입력 방식을 채택하지 않을 것이다.

최근 음성 인식에 진보된 머신러닝 기술이 적용되면서 인식의 정확도가 크게 올라가고 있다. 95%에 미

치지 못하던 음성 인식 서비스의 정확도가 영어 기준으로 99% 이상까지 올라갔다. 숫자 자체로는

95%와 99%의 차이가 커 보이지 않지만, 20번에 1번 오류와 100번에 1번 오류는 엄연히 다르

다. 소비자의 신뢰도 측면에서 차이가 생기게 되고, 지속적으로 사용하게 할 수 있는 유인에 변화

가 일어나기 때문이다.

머신러닝 기술 발전의 중심에는 하드웨어의 발전과 빅데이터의 형성에 있다. 하드웨어의 연산 속도가

충분하지 않을 때는 연산량 부담이 낮은 로직을 적용할 수 밖에 없었다. 주로 사용된 로직은

HMM(Hidden Markov Model)이다. HMM을 사용한 음성 인식은 말하는 속도, 발음, 말투가 모두

다르고 반향, 잔향과 주변 노이즈도 많기 때문에 인식률이 90%를 넘기는 것이 상당히 어려웠다.

하지만 최근에는 딥러닝, 그 중에서도 순환 신경망(RNN, Recurrent Neural Network)이라는 모

델을 주로 사용한다. Fast-LSTM(Fast Long Short Term Memory Unit)이라는 모델도 사용된다.

순환 신경망은 충분한 데이터가 있을 경우 HMM보다 훨씬 정확도가 높다. 하지만 막대한 컴퓨팅

파워가 필요한 것이 단점이다. 과거의 CPU를 주로 사용하는 컴퓨팅에서는 순환 신경망을 제대로

실행시키기가 힘들었다. 그러나 최근 CPU 대신 GPU를 사용하는 헤테로지니어스 컴퓨팅이 등장

하면서 상황이 바뀌었다. GPU는 순환 신경망 실행에 필요한 단순 반복 패턴 연산에 적합하다.

GPU를 통해 연산량에 대한 부담은 크게 낮아지게 되었다. 과거와 다르게 연산량이 많이 필요하지

만 정확도가 훨씬 높고 다양한 경우를 모두 포괄할 수 있는 방식인 순환 신경망을 음성 인식에 적용하게

되면서 인식률이 빠르게 올라갈 수 있게 된 것이다.

음성 인식에서의 딥러닝 활용은 음성을 다양한 요소로 분할하고 각 요소에 해당하는 최적의 계수

값을 찾는 과정이다. 최적의 계수 값을 찾고 난 이후에 이 인공 신경망에 인식시키고 싶은 입력을

넣으면 인식을 할 수 있다. 음성을 구성하는 구성 요소의 수와 학습시키는 데이터가 많으면 각각의

요소에 부여된 계수 값은 모든 경우를 포괄할 수 있는 시스템이 되어 인식률을 높이게 되는 것이

다. 하드웨어 혁신으로 연산량에 대한 부담이 낮아진 상황에서 오랜 기간 축적된 데이터 베이스를

적용하면서 만족할 만한 수준의 음성 인식이 가능한 시스템을 구현할 수 있게 되었다.

그림 4. 딥러닝의 전개 도면: 다중 뉴럴 네트워크 통한 학습 방법

주: 각 노드는 입력 데이터에 가중치를 적용한 후 다음 노드의 신뢰도 점수 출력 신경망에 오류 결과 재송 가중치 조절. 모델 개선 오류가

더 이상 줄어들지 않을 때(최적값)까지 수천, 수만번 과정 반복. 자료: MarR, 미래에셋대우 리서치센터

Page 10: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

10 Mirae Asset Daewoo Research

그림 5. 머신러닝: GPU 사용, 클라우드 적용 등으로 크게 발전 그림 6. 머신러닝 비용 함수: 최저 비용까지 가중치 변화시켜 계산 반복

자료: Baidu, 미래에셋대우 리서치센터 자료: Stackoverflow, 미래에셋대우 리서치센터

사람이 말한 소리는 컴퓨터가 푸리에 변환(Fourier Transform)을 통해 디지털 신호인 음향 스펙트

럼으로 바꾼다. 만들어진 음향 스펙트럼 데이터는 머신러닝을 위한 순환 신경망에 입력된다. 순환

신경망은 각 음절을 앞 뒤에 배치된 음절을 고려해 단어로 인식한다. 예를 들어 ‘Hello’라고

말하면 소프트웨어는 음절을 기준으로 HHH_E__LL_LO___, HHH_E___L_L_OH__, YY__

E__LL_LO_W_등으로 인식한다. 이 다음 반복되는 문자와 공백을 제거하고 Hello, Hell oh,

Yellow와 같은 단어들로 인식한다. 이 후 앞 뒤 문장을 보고 과거 학습했던 데이터나 저장하고 있

는 참고 텍스트 등을 활용해서 가장 확률이 높다고 생각되는 단어 Hello로 최종 인식하게 된다.

인식된 단어들은 역시 신경망이 과거에 학습한 데이터를 바탕으로 가장 확률이 높은 단어들로 대

체되어 문장을 형성한다. 사람은 ‘Hello world’라고 발음했는데, 발음이 부정확해서 ‘world’를

‘work’라고 컴퓨터가 인식해도 더 보편적이고 확률이 높은 ‘Hello world’라는 문장으로 자동으로

바꾸는 식이다. 즉 최근 신경망을 적용한 음성 인식 소프트웨어는 각 음절의 발음을 인식하는 능력

보다 데이터를 많이 확보해서 확률 높은 앞 뒤 음절, 단어, 문장을 배치하는 기술이 더 중요하다.

즉 데이터가 많으면 많을수록 인식률이 높아짐에 따라 더 많은 데이터를 가지고 있는 업체가 양질의 음

성 인식 서비스를 만들 수 있게 되는 것이다. 이러한 관점에서 검색 엔진 업체가 상당히 유리하다.

신경망을 통한 음성 인식 과정: Connectionist Temporal Classification(CTC)

신경망이 음성을 분석하면 문자별로 위치할 가능성이 가장 높은 문자가 학습을 통해 배치되는 과정

P | {0.1HHH_E__LL_LO___"HELLO" version1

0.02HH__E__LL_LO____"HELLO" version2

0.01HHH_E__L_L_OH__"HELLOH"

0.01HHH_EE_LL_L_O__"HELLO" version3

… YY__E__LL_LO_W_"YELLOW"

HELLO . . . …

Page 11: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 11

4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도 증대

서로 다른 프로세서를 각기 다른 연산에 적용하는 헤테로지니어스 컴퓨팅의 확장과 메모리 중심 컴퓨팅

등으로 머신러닝의 성능은 더욱 올라갈 것이다. 이를 통해 음성 인식 플랫폼의 완성도는 한 단계 더 개

선될 것으로 기대한다. 지금까지는 머신러닝 성능 개선의 중심에 GPU가 있었지만, 향후

FPGA(Field-Programmable Gate Array)와 머신러닝 전용 ASIC(application specific integrated

circuit)의 적용 등으로 머신러닝에 적합한 하드웨어 개선은 더욱 빠르게 진행될 것이다. GPU는 주

변에서 쉽게 구할 수 있고 여러 분야에 적용이 가능하며 프로그래밍 생태계가 풍부하다는 장점이

있다. 하지만 머신러닝 관점에서는 머신러닝에 필요한 연산에만 최적화되어 있지 않아 효율이 떨어

지는 단점이 있다.

머신러닝이 더 대중화된다면 머신러닝 연산에만 특화된 ASIC을 적용할 수 있게 된다. ASIC는 말

그대로 특정 연산에 특화된 반도체로서 특정 연산에서는 높은 연산 속도와 낮은 전력소모량을 보

이게 된다. 반면 맞춤형 반도체이기 때문에 범용적으로 만든 CPU 또는 GPU에 대비해서 가격이

비싸다는 단점이 있다. 향후 머신러닝 시장이 규모의 경제를 이룰 수 있게 되면 머신러닝에 필요한

연산 능력을 고려한 단가는 GPU보다 더 낮아질 수 있을 것이다.

2017년 하반기에 등장한 메모리 중심 컴퓨팅도 머신러닝 성능 향상에 크게 도움이 될 것이다. 앞서 언

급했듯이 머신러닝은 대규모 데이터를 중심으로 이루어진다. 대규모 데이터를 활용해서 최적의 계

수 값을 찾아내고, 이들 데이터와 비교해서 가장 가까운 값을 찾아내는 등 끊임없이 대규모 데이터

를 읽고 또 저장해야 한다. 이와 같은 연산 조건은 프로세서 파워는 높은데 메모리 성능이 떨어지

는 현대의 컴퓨팅 환경에 적합하지 않다. 특히 메모리와 프로세서 간의 데이터 전송 시 병목 현상

이 문제다. HDD를 SSD로 바꾸고 DRAM의 속도를 높이며 프로세서의 캐시 메모리 단계를 늘리

는 등의 노력을 하고 있지만 여전히 부족한 부분이 많다.

이에 업계는 메모리 중심 컴퓨팅이라는 개념을 제안하면서 1950년대에 만들어진 컴퓨터의 구조를

크게 바꾸려고 하고 있다. 메모리 중심 컴퓨팅이란 데이터 센터 내에 서버 구조를 바꾸는 것이다.

현재 데이터 센터는 각각의 서버에 프로세서, DRAM, 스토리지가 모두 장착되어 있고, 같은 구조

의 서버가 수 천, 수 만대 존재한다. 이런 구조에서는 각 서버들이 서버 내부의 데이터에 접근하는

것은 빠르지만 다른 서버에 위치한 데이터를 접근하는 것은 매우 느리다. 다른 서버의 데이터는 이

더넷 등을 통해서 접근해야 되기 때문이다.

그림 7. HPE가 발표한 메모리 중심 컴퓨팅의 프로토 타입, ‘The Machine’

자료: HPE, 미래에셋대우 리서치센터

Page 12: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

12 Mirae Asset Daewoo Research

메모리 중심 컴퓨팅은 데이터 센터 내 서버들의 프로세서는 프로세서들끼리, 메모리는 메모리들끼

리 분리한다. 메모리는 모두 합쳐지면서 거대한 메모리 풀을 만든다. 이런 구조에서는 프로세서들

이 모두 동일한 속도로 메모리 풀에 저장된 데이터에 접근이 가능해진다. 병렬 처리도 매우 유리해

진다. 서버 내에 저장된 데이터를 접근하는 것보다는 느리지만 데이터 센터 내의 평균 데이터 접근

속도를 크게 올려준다. 기존에 처리하던 연산보다 머신러닝 연산에 유리한 구조다.

최근 차세대 메모리 양산이 가시화되는 점도 데이터 센터 내 데이터 접근 속도를 끌어 올려줄 것으로 예

상된다. 현재 컴퓨팅 구조의 시스템 메모리인 DRAM과 스토리지인 SSD의 속도 차이는 대략 10

배 가까이 난다. 여기서 데이터 처리 병목 현상이 심하다. MRAM, ReRAM 등 최근 논의 중인 차

세대 메모리는 DRAM과 유사하거나 DRAM과 SSD 중간 정도의 속도와 가격을 목표로 하고 있

다. 이는 메모리 간 속도 차이로 인한 병목 현상을 크게 줄여줄 것이고 저렴한 가격에 높은 성능의

스토리지를 만들 수 있어 데이터 처리 성능을 크게 올려줄 것이다.

그림 8. 메모리 중심 컴퓨팅의 개념

주: 데이터 센터 내 거대한 메모리 풀에 프로세서들이 병렬로 데이터에 접근

자료: HPE, 미래에셋대우 리서치센터

그림 9. 메모리 중심 컴퓨팅의 개념

자료: Western Digital, 미래에셋대우 리서치센터

Page 13: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 13

5. 음성 인식 스피커는 음성 인터페이스 시장의 핵심 단말

글로벌 IT 업체들이 TV, 냉장고 등 자사의 가전기기에 음성 인식 기능을 탑재하고 있는 추세이다.

사용자 경험의 확장성을 고려할 시 이는 적절한 대응이 아니라고 판단한다. 음성 인터페이스의 효

용가치를 극대화시키기 위해서는 각각의 기기가 가진 기존 기능을 보완하는 보완재가 아닌 모든

기기를 제어할 수 있는 새로운 플랫폼의 ‘컨트롤 타워’가 되어야 한다. 따라서 음성 인식 기능을

수많은 기기에 개별적으로 장착하기 보다는 하나의 독립적인 단말에 탑재시켜 사용자의 ‘보조자’로서

다양한 역할을 수행할 수 있도록 해야 한다.

기기 자체에 탑재된 음성 인터페이스의 활용은 해당 기기의 전원을 제어하는 것에 한정되어 있다.

음성 인식 스피커로는 네트워크에 연결된 모든 기기들을 컨트롤 할 수 있고 VoIP 기반의 전화도 지원할

수 있다. 또한 쇼핑 및 콘텐츠 검색 등으로의 확장성이 뛰어나 사용자 경험을 빠르게 높여 갈 수 있다.

음성 인터페이스라는 새로운 시대는 음성 인식 스피커라는 새로운 단말을 통해 열릴 것이다. 시장을 선

점하기 위한 경쟁은 이미 시작되었다. 국내외 유수의 플랫폼 업체들이 경쟁적으로 음성 인식 스피

커를 출시 중에 있다. 현재 시장은 아마존의 에코와 구글의 구글홈으로 양분되어 있으며, 애플이

지난 6월 홈팟을 공개했고 올해 연말부터 판매 예정이다. 마이크로소프트의 코타나 엔진을 탑재한

인보크도 연내 출시될 예정이다. 국내에서는 SK텔레콤, KT, 네이버, 카카오 등이 제품을 출시했고,

삼성전자도 하만과 협력해 빅스비를 탑재한 스피커를 개발 중이다.

표 3. 국내외 음성 인식 스피커 출시 현황

기업명 산업군 제품명 출시일 가격

아마존 소비재 Echo 2014년 11월 $100

구글 인터넷 Google Home 2016년 11월 $129

애플 IT HomePod 2017년 12월(예정) $349

SK텔레콤 통신서비스 NUGU 2016년 9월 249,000원

KT 통신서비스 기가지니 2017년 1월 299,000원

네이버 플랫폼 WAVE 2017년 8월 150,000원

카카오 플랫폼 카카오미니 2017년 9월 119,000원

자료: 언론 종합, 미래에셋대우 리서치센터

그림 10. 업체별 음성 인식 스피커

자료: 언론 종합, 미래에셋대우 리서치센터

Page 14: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

14 Mirae Asset Daewoo Research

업체들 간의 경쟁이 치열해지는 가운데 최종 승자는 누가될 것인지에 대한 시장의 궁금증도 커지

고 있다. 기술적인 측면에서 고려할 시 구글이 지배적 사업자가 될 가능성이 가장 높다고 판단한다. 그

다음은 아마존이 따를 확률이 높을 것으로 예상한다.

앞서 언급했듯이 머신러닝 기술 수준은 로직의 정교함보다는 풍부한 데이터가 좌우한다. 신경망에

투입할 수 있는 데이터가 많은 쪽이 무조건 유리하다. 구글은 전세계에서 가장 많이 이용되고 있는

검색 엔진인 ‘구글’을 통해 전세계 IT 업체 중 가장 많은 데이터를 확보 중이다. 연간 15억대 이상 팔

리는 ‘안드로이드’ 플랫폼도 보유하고 있다. 거기에 최근 무료로 풀어버린 머신러닝 오픈소스 라이

브러리 ‘텐서플로우’는 전세계의 수많은 개발자들이 머신러닝 소프트웨어의 기반으로 사용하고 있

다. 구글은 이렇듯 다수의 플랫폼을 바탕으로 방대한 음성 인식 데이터들을 수집하고 있어 음성 인

식 서비스의 수준이 좋을 수 밖에 없다. 구글이 어렵게 개발한 머신러닝 플랫폼을 무료로 제공하기

시작한 초기에는 많은 사람들이 의아하게 생각했다. 하지만 머신러닝의 정확도는 로직의 정교함이

아니라 확보할 수 있는 데이터의 양이 결정한다는 점을 감안하면 구글의 의도를 이해할 수 있다.

그림 11. 글로벌 검색 엔진 시장 점유율 그림 12. 구글의 데이터 센터

주: 2017년 9월 기준, 데스크탑/테블릿PC/모바일 합산

자료: StatCounter, 자료: 미래에셋대우 리서치센터

자료: 구글, 미래에셋대우 리서치센터

아마존도 강력하다. 아마존은 구글과 같은 안드로이드 플랫폼은 없다. 에코가 잘 팔리고는 있으나

안드로이드를 탑재한 스마트폰에 비해서는 판매량이 비교할 수 없을 정도로 적다. 하지만 아마존

에게는 세계 최대 클라우드 서비스인 AWS(Amazon Web Service)라는 무기가 있다. 전세계 클라

우드 시장의 40% 이상을 점유하고 있는 AWS를 통해 방대한 양의 데이터를 수집하고 있다. 2016년에

는 Re:Invent라는 개발자 행사에서 AWS를 이용하는 제조사 및 서비스 업체들에게 머신러닝 플

랫폼을 오픈소스처럼 활용할 수 있도록 했다. 해당 플랫폼이 제공하는 이미지 인식(Recognition),

텍스트 변환(Amazon Polly), 대화형 기술(Lex)이라는 기능을 통해 자체 개발 없이도 인공지능 기

술을 서비스할 수 있게 된 것이다. 서비스 과정에서 생성된 데이터는 다시 AWS의 데이터 베이스

로 축적되면서 음성 인식률을 제고하는 데에 크게 기여할 수 있을 것으로 전망한다.

아마존은 음성 인터페이스의 핵심 서비스인 커머스에 강력한 플랫폼과 소비자에 특화된 데이터를 보유

하고 있다. 또한 프라임 서비스를 통해 영화, 드라마, 음악 등 미디어 콘텐츠 시장에서도 영향력을 발휘

하고 있다. 음성 인식의 기술적 측면에서는 구글에 밀릴 수 있지만, 자체적으로 제공하고 있는 커

머스 플랫폼 및 콘텐츠 서비스에 기반한 소비자 데이터까지 고려한 시장 지배력을 감안하면 구글

에 뒤지지 않을 것으로 판단한다.

Google

91.8

Bing

2.6

Yahoo

2.3

Baidu

1.4 Other

1.8

Page 15: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 15

그림 13. 아마존의 클라우드 서비스 AWS 그림 14. 아마존의 프라임 서비스 요금제

자료: 아마존, 미래에셋대우 리서치센터 자료: 아마존, 미래에셋대우 리서치센터

이에 비해 애플이나 기타 기업들의 음성 인식 서비스는 경쟁이 다소 불리해 보인다. 애플은 매우 높은

소프트웨어 기술을 가지고 있지만 데이터 보유 규모가 구글이나 아마존보다 떨어진다. 데이터를

수집할 수 있는 통로가 자사 디바이스 뿐인데 연간 판매량에서 구글의 안드로이드에 크게 못 미친

다. 미국 내 점유율은 40% 이상에 육박하고 있고, 음성 인식 소프트웨어의 이용 빈도 면에서는 안

드로이드보다 높을 것으로 추정된다. 하지만 애플의 개인정보를 다루는 철학 또한 경쟁 업체 대비

불리한 요소다. 애플은 타 업체 대비 개인 정보 보호를 매우 중요시한다. 디바이스를 통해 수집된

음성 데이터를 익명으로 처리하고 일정 시간이 지나면 모두 삭제한다. 데이터를 서버로 전송해서

처리하지 않고 단말기 자체 내에서 처리하고자 하는 개발 방향도 타 업체들과 다르다. 이러한 방식

은 사용자들의 프라이버시에는 유리하지만 기업 입장에서는 타 업체 대비 불리한 이유다.

삼성전자나 네이버 같은 업체들은 구글, 아마존, 애플 등 글로벌 업체 대비 사용자 기반이 작다는 점에

서 불리하다. 삼성전자의 빅스비는 동사의 단말기를 사용하는 사람에게서만 데이터 수집이 가능하

다. 네이버도 글로벌 경쟁 측면에서 본다면 데이터 양에 있어서 구글에 크게 뒤진다. 하지만 국내

검색 엔진에서의 사업력을 통해 한국어 기준의 음성 인터페이스 플랫폼에서는 충분히 영향력을 발

휘할 수 있다고 판단한다. 또한 라인의 영향력이 높은 일본과 일부 동남아시아 국가에서도 유사한

상황을 기대할 수 있다.

그림 15. 삼성전자의 AI 플랫폼 ‘빅스비’ 그림 16. 국내 검색 엔진 시장 점유율

자료: 삼성전자, 미래에셋대우 리서치센터 주: 2017년 9월 기준, 데스크탑/테블릿PC/모바일 합산

자료: StatCounter, 미래에셋대우 리서치센터

Google

67.1

NAVER

26.1

DAUM

4.6

Other

2.3

Page 16: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

16 Mirae Asset Daewoo Research

국내에서는 SK텔레콤, KT, LG유플러스 등과 같은 통신서비스 업체에도 충분히 기회가 있는 시장이라고

판단한다. 사용자간의 음성 통화를 통해 음성 데이터를 다량 확보할 수 있는 여건을 가지고 있다.

해당 데이터를 사용하는 것에 법적인 문제가 있으나, 활용이 가능해질 경우 통신서비스 업체들에

게 매우 유리하게 작용될 수 있다. 뿐만 아니라 강력한 단말기 유통 채널을 보유하고 있어 음성 인

식 스피커 등의 디바이스 보급을 통해 초기 시장에서 지배력 확보가 가능할 것이다.

또한 음성 인터페이스의 주요 3대 사용 영역 중 IoT(홈)와 콘텐츠(IPTV) 부문에서 사업을 영위하고

있다. 홈 IoT 영역에서는 IT, 건설, 미디어 등 다양한 산업과의 제휴를 통해 적극적으로 서비스와

제품을 출시하고 있다. IPTV의 경우 국내 유료방송 시장에서 이미 시장 지배적 사업자가 된 것으

로 파악되며, VOD 등의 부가수익 증가로 매출액 또한 지속적으로 증가 추세이다. SK텔레콤의 경

우에는 자회사 SK플래닛의 11번가를 통해 커머스 부문의 서비스도 제공 가능하고, 자사 내비게이

션 서비스인 T맵을 통해서 사용자 경험을 획득할 수 있다.

표 4. 국내 통신 3사 IoT 및 IPTV 서비스 현황

구분 SK텔레콤 KT LG유플러스

IoT 회선 수 217만개 203만개 143만개

시장 점유율 38.6% 36.0% 25.4%

IPTV 가입자 수 429만명 740만명 343만명

시장 점유율 13.4% 23.2% 10.8%

주: 2017년 9월 가입자 수 기준, 홈 IoT 가입 회선 및 MVNO는 제외; 자료: 각 사, 과기부, 언론 종합, 미래에셋대우 리서치센터

그림 17. 유료방송 시장 점유율 현황 (2017년 9월 가입자 수 기준)

주: 케이블 방송의 경우 2016년 7월~12월 월평균 가입자 수에 3% 증가율 적용; 자료: 각 사, 과기부, 미래에셋대우 리서치센터

그림 18. 통신 3사 IPTV 매출액 성장세 지속

자료: 각 사, 미래에셋대우 리서치센터

위성방송

7.8

KT

23.2

SK텔레콤

13.4

LG유플러스

10.8

케이블방송

44.8

- IPTV: 47.4%

(통신3사 점유율 합산)

- 케이블방송: 44.8%

- 위성방송: 7.8%

50

100

150

200

250

300

350

1Q15 2Q15 3Q15 4Q15 1Q16 2Q16 3Q16 4Q16 1Q17 2Q17 3Q17

(십억원)

KT

SK텔레콤

LG유플러스

Page 17: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 17

II. 사물인터넷 성장 본격화

1. 사물인터넷 시장을 여는 인터페이스 변화에 주목

유선인터넷 및 무선인터넷의 경우를 살펴보면 인터페이스의 변화가 시장을 여는 것에 매우 중요한

역할을 했던 것을 확인할 수 있다. 마우스의 개발이 없었다면 유선인터넷 시대가 빠르게 성장하지

못했을 것이고, 정전용량 방식의 터치가 도입되지 않았다면 무선인터넷 시대가 오지 않았을 수도

있다. 애플이 아이폰에서 정전용량 방식의 터치를 도입하기 이전에는 저항막 방식의 터치를 적용

하고 있었다. 같은 터치지만 압력을 인지하는 저항막 방식의 터치 입력은 마우스로 치면 클릭 이상

의 기능을 할 수가 없었다. 현재 스마트폰에서 다양하게 사용하고 있는 드레그, 스크롤 및 멀티 터

치 등의 기능이 지원되지 않거나, 지원이 되더라도 사용의 불편함이 높아 소비자들이 대부분 외면

했었다.

사물인터넷의 인터페이스도 고민해보아야 한다. 기존의 사물인터넷 인터페이스는 스마트폰을 활용

한 터치이다. 사물인터넷에 적합하지 않은 인터페이스이기 때문에 시장이 열리는 것이 지연되고

있다고 판단한다. 최근 음성 인식 스피커 등의 다양한 스마트 기기에 음성이라는 새로운 인터페이

스가 도입되고 있어 사물인터넷 시장 성장의 본격화가 기대된다.

음성 인터페이스의 도입은 사물인터넷 기기 컨트롤을 위한 인터페이스 환경을 편리하게 함으로서 새로

운 가치를 부여할 것이다. 이미 상용화된 서비스의 경우 스마트폰으로 사물인터넷 기기들을 컨트롤

해야 한다. 예를 들어 에어컨의 전원을 작동하고자 하면 먼저 스마트폰을 찾아서 사물인터넷 애플

리케이션을 실행하고, 해당되는 방과 에어컨을 찾아 전원을 켜고 끄는 과정을 거치게 된다. 직접

에어컨의 전원을 조작하는 것보다 번거롭기 때문에 사물인터넷의 핵심인 ‘연결’의 필요성을 인지하

기 어렵다. 인공지능 스피커에 “거실 에어컨 켜”와 같이 간단한 음성 명령으로 기기 제어가 가능하

다면 편리성을 더욱 크게 증진시키게 될 것이며 소비자의 수요를 자극하기에도 충분할 것으로 판

단한다.

그림 19. 하드웨어별 인터페이스의 변화

자료: 미래에셋대우 리서치센터

Page 18: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

18 Mirae Asset Daewoo Research

2. 사물인터넷의 보급 과정은 앞선 인터넷 시대와 상이할 전망

유선인터넷이 활성화된 배경에는 웹이라는 대상이 있었다. 다수의 업체가 웹을 구축해서 무료로 정

보와 편리성을 제공해 주는 것이었다. 소비자는 단말인 PC를 구매해서 인터넷을 활용할 수 있었다.

이후 기술의 발전과 함께 빠른 네트워크 속도를 제공하는 초고속 통신망이 도입되면서 PC 수요는

가속화되었다. 무선인터넷의 발전도 이와 유사한 흐름을 보인다. 애플이 아이팟 터치를 통해 애플리

케이션(이하 앱)이라는 개념을 최초로 도입했다. 다수의 앱이 개발되어 있는 상황에서 이를 활용하기

위해 스마트폰을 공급한 것이고, 더욱 편리한 이용 환경에 대한 수요가 LTE를 가입하는 과정이었다.

사물인터넷 시대는 다른 발전 과정을 보일 것이다. 가장 중요한 이유는 가격의 차이에 있다. 웹과

앱은 대부분 무료였지만, 사물인터넷의 대상인 기기들은 모두 비용을 지불해야 하는 부담이 있다.

반면 PC와 스마트폰은 고가인데 비해 사물인터넷 단말인 인공지능 스피커는 비교적 저렴하다. 따

라서 사물인터넷은 1) 전용 통신망 구축이 완료되어 있는 상황에서 2) 적합한 단말이 출시 및 공급되고,

3) 대상이 되는 기기들이 보급되면서 4) 관련 서비스가 장착되는 과정으로 발전할 것이다.

성장의 과정이 바뀌면서 시장이 급격한 성장세를 보이는 시점도 차이를 보일 것이다. 앞선 두 인터

넷 시대에는 대상과 단말이 어느 정도 보급된 후 전용 통신망이 도입되면서 급격한 성장세를 보였

다. 소비자의 만족도가 크게 올라가는 시기로 해석할 수 있다. 사물인터넷도 전용 단말이 보급되면서

관련 기기가 순차적으로 출시되는 시기에 고속 성장을 시현할 것으로 예상한다. 이는 향후 1~2년 내에

도래하는 임박한 시기라고 판단한다.

그림 20. 인터넷별 발전 단계 도식

자료: 미래에셋대우 리서치센터

그림 21. 1999년 초고속인터넷 도입과 함께 가구 인터넷 보급률 급성장

주: 인터넷 보급률은 인터넷 접속이 가능한 가구의 비율이며, 이동통신망을 통한 무선인터넷(이동전화 무선인터넷) 접속은 제외

자료: 과기부, 한국인터넷진흥원, 통계청, 미래에셋대우 리서치센터

웹사이트

애플리케이션

PC(모뎀 기반)

스마트폰(3G 기반)

사물인터넷 기기(기존 통신망 기반)

초고속 통신망도입

LTE 통신망도입

IoT 전용 통신망도입

PC 구매와 초고속통신망 동시 가입

비즈니스 모델 확대(앱의 다양화)

새로운 서비스다출현

<대상> <단말> <통신망> <고속 성장기>

유선인터넷

무선인터넷

사물인터넷

대상 기기의 보급인공 지능 스피커

(음성 인터페이스 도입)

0

25

50

75

100

0

6

12

18

24

99 00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15

(%)(백만명)

초고속인터넷 가입자 수 (L)

가구 인터넷 보급률 (R)

Page 19: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 19

3. 사물인터넷 전용 통신망 활용 필요

사물인터넷 기기는 네트워크에 연결되지 않은 기기보다 더욱 편리해야 하고 신뢰성이 있어야 한

다. 집안에 있는 에어컨, 보일러 및 스위치 등을 네트워크에 연결하는 작업이 번거롭지 않아야 할

뿐만 아니라 항상 안정적으로 서비스가 되어야 한다. 현재 홈 IoT 망으로 활용되고 있는 WiFi나

블루투스보다는 사물인터넷 전용 통신망이 활용되어야 할 것이다. 사물인터넷 전용 통신망은 셀룰

러 망과 유사한 특징을 가지고 있어 소비자가 직접 네트워크에 등록하지 않아도 된다. 구매 절차

또한 간단하다. 핸드폰을 구매하듯이 서비스 업체를 통해 쉽게 구매할 수 있다.

음성이라는 편리한 인터페이스를 도입하더라도 기본적인 네트워크에 문제가 발생하면 효용이 떨어

진다. WiFi를 활용하면 WiFi AP가 오작동 하거나 전원이 꺼지는 경우가 생길 수 있다. 또한 기지

국이 없이 비인가 대역을 활용하기 때문에 망 자체에 문제가 발생할 수 있어 신뢰성이 낮을 수 밖

에 없다. 네트워크의 문제로 기본적인 연결에서 불안정함을 보이게 되면 사물인터넷을 이용하는

데에 있어 소비자는 오히려 불편함을 느끼게 될 것이고 종국적으로는 음성 인식 플랫폼을 사용하

지 않게 될 수 있을 것이다. 안정적이고 신뢰성 있는 서비스를 제공하기 위해서는 NB IoT 등 사물인터

넷 전용 통신망을 적극 활용하는 것이 필요하다고 판단한다.

표 5. IoT 네트워크별 특징 비교

구분 커버리지 배터리 수명 모듈 비용 주파수 대역 대역폭 속도

LoRa ~ 15Km (시골), ~ 5Km (도시) ~ 10년 ~ $5 비면허 대역 (920MHz) ~ 500KHz < 5Kbps

NB-IoT ~ 15Km ~ 10년 ~ $10 면허 대역 (LTE) 200KHz ~ 100Kbps

Sigfox ~ 30Km (시골), ~ 10Km (도시) ~ 10년 ~ $5 비면허 대역 (920MHz) 200KHz < 1Kbps

주: SK텔레콤은 2016년 4월 LoRa 전국망 구축 완료, KT와 LG유플러스는 NB-IoT 채택하여 2017년 7월 구축 완료

자료: 각 사, 언론 종합, 미래에셋대우 리서치센터

사물인터넷 전용 통신망의 활용도 및 시너지 창출의 측면에서 LG유플러스에 주목할 필요가 있다. 계열

사로 둔 LG전자는 가전 부문에서 지배적인 사업자이다. 에어컨 및 TV 등 음성 인터페이스가 유용

하게 사용될 수 있는 LG전자의 핵심 가전에 NB IoT 모듈과 서비스를 기본으로 장착하고, LG유플

러스의 음성 인식 스피커와 쉽게 연동되도록 솔루션을 제공하면 빠르게 시장 지배력을 강화할 수

있을 것이다. NB IoT 네트워크 사용 요금의 경우 매월 소비자에게 부과하기 보다는 계약을 통해

제품의 수명까지 시리얼 넘버에 연동하여 LG전자로부터 일시에 납부 받는 방식이 더욱 유효할 것

으로 판단한다.

인터넷 시대에서는 초기에 플랫폼을 선점하는 것이 중요하다. 음성 인식 스피커를 통해 가정 내 기

기들을 쉽고 편리하게 제어할 수 있게 되는 점은 차별화되는 포인트가 될 수 있고 초기 시장 선점

에 유리하게 작용할 것이다. 물론 타 통신서비스 및 인터넷 업체들도 삼성전자 및 LG전자와의 제

휴를 통해 유사한 전략을 구사할 수 있지만, 계열사간의 제휴보다 빠르고 유기적인 대응이 쉽지는

않을 것이라는 측면에서 LG유플러스가 가장 유리해 보인다.

그림 22. LG유플러스 홈 IoT 패키지 상품: 플러그, 스위치, 홈CCTV, 가스잠그미, 열림알리미 등

자료: LG유플러스, 미래에셋대우 리서치센터

Page 20: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

20 Mirae Asset Daewoo Research

4. 홈 플랫폼의 확장 차량

가정에 도입된 음성 인터페이스 기반의 사물인터넷은 차량으로 확장되면서 그 효용성이 더욱 배가

될 수 있을 것이다. 주행 시 핸들 조정으로 손이 자유롭지 못한 차량이야말로 음성 인터페이스가

가장 필요한 곳이기 때문이다. 차량 내에서의 사물인터넷 단말은 차량 내에 탑재된 인포테인먼트

가 가장 유력하지만 자동차 산업의 특성상 빠른 시일 내에 적용되긴 어려울 것으로 보인다. 따라서

현재 운전자가 가장 많이 사용하는 스마트폰용 내비게이션이 음성 인터페이스를 지원하는 사물인

터넷의 단말이 될 확률이 높다.

차량으로의 확장에 있어서는 국내에서 이용률이 가장 높은 차량용 내비게이션 T맵을 보유 중인

SK텔레콤이 유리해 보인다. 이미 SK텔레콤은 기존 T맵에 음성 인식 기능을 장착한 ‘T맵X누구’의

서비스를 시작했다. 아직은 내비게이션 관련 기능만 지원하지만 점차 통화 및 메시지, 가정의 사물

인터넷 컨트롤 기능까지 지원을 확장해 나갈 것으로 예상한다. 해당 기능들이 지원될 시 운전자의

판단 하에 집에 도착하기 전 “10분 후에 에어컨 켜”와 같은 명령을 내릴 수 있어 사물인터넷의 효

용성을 증대시킬 수 있을 것이다.

내비게이션 외에는 음성 인식 스피커와 같은 소형 기기가 차량 내 음성 인터페이스를 지원하는 사

물인터넷 단말기가 될 수도 있을 것이다. 음성만 출력하면 되기 때문에 비교적 낮은 사양의 스피커

와 마이크로 구성되어도 충분하다. 소형이며 시거젝에서 전력을 공급받도록 하고, 편리성을 위해

NB IoT를 지원하도록 기획되면 좋을 것이다. 그러나 추가적인 구매가 필요하고 NB IoT 통신 요금

부담도 있어 내비게이션을 통한 서비스가 더 우위를 보일 것으로 판단한다.

최종적으로는 차체에 내장될 것이고 어떤 플랫폼을 채택할 지는 자동차 업체가 결정하게 될 것이

다. 자동차 업체가 자체적으로 하기보다는 홈 IoT 등과 연계된 플랫폼 특화 업체와 제휴할 가능성

이 더 높다고 판단한다. 차량용 음성 인터페이스 플랫폼은 단순히 차량용 사물인터넷 단말의 역할

뿐만 아니라 향후 자율주행차에서도 핵심 플랫폼 역할을 하게 될 가능성이 높다. 레벨4 이상의 자

율주행차가 보급되면 차량과 소통하는 방식도 음성이 될 가능성이 높다. 사물인터넷 단말로서 경

험과 데이터를 쌓는다면 자율주행차의 컨트롤 플랫폼에도 채택될 가능성이 높을 것이다.

그림 23. 홈 IoT의 영역 확대 가정 및 차량용 사물인터넷 연계 서비스 도입 부가가치 증대 소비자 수요 증가

자료: Deloitte, 미래에셋대우 리서치센터

Page 21: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 21

5. 홈 플랫폼의 진화 커머스 및 콘텐츠

사물인터넷 기반의 플랫폼으로 음성 인터페이스 시장을 선점하고 나면 본격적인 성장은 커머스와

콘텐츠 소비에서 찾을 수 있다. 신규 플랫폼의 등장은 시장 성장의 촉매제가 된다. 전자상거래와

같은 온라인 쇼핑 플랫폼의 등장은 오프라인에 집중되었던 소비 시장을 더욱 확장시켜주는 계기가

되었다. 콘텐츠 시장에서도 신규 플랫폼의 시장 진입에 따른 변화가 일어났다. IPTV, OTT 등 새로

운 미디어 플랫폼은 콘텐츠 유료화를 이끌었고, VOD와 같은 부가수익 증대에도 크게 기여했다.

음성 인터페이스 시대에서 커머스의 핵심은 소비자 데이터와 추천 알고리즘, 물류의 경쟁력에 있

다. 음성으로 주고 받는 과정은 선택이 많을 수도 없고, 선택의 단계가 많아서도 안된다. 결국 소비

자 데이터를 직접 가지고 있거나 몇 가지의 질문을 통해 소비자 선호를 파악하여 맞춤형 상품을

추천해 줄 수 있어야 한다. 배송과 반송의 용이성 또한 중요한 경쟁 요인이 될 것으로 판단한다.

VOD 기반의 콘텐츠 소비 역시 증가할 것이다. 모바일 기기의 경우 검색은 용이한 반면 화면이 작

다. TV의 경우 화면은 크지만 검색이 불편한 단점이 있다. 음성으로 검색을 하게 되면 원하는 콘텐

츠를 쉽게 찾을 수 있게 된다. 음성 인식률이 높아지고 추천의 정확도가 올라가면서 구매하는 과정

이 단순해지면 콘텐츠 소비가 당연히 증가할 수 밖에 없을 것으로 전망한다.

그림 24. 음성 인터페이스 활용 영역의 확대: 커머스

자료: 미래에셋대우 리서치센터

그림 25. 음성 인터페이스 활용 영역의 확대: 콘텐츠

자료: 미래에셋대우 리서치센터

Page 22: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

22 Mirae Asset Daewoo Research

III. 인터넷 플랫폼의 진화

1. 음성 인식을 통해 확대되는 플랫폼 지배력

1) 음성 인터페이스는 인터넷 플랫폼 확대의 촉매제

인터넷 기업의 플랫폼 사업은 음성 인식 및 오디오를 통해서 지배력이 확대될 수 있다. 기존 인터

넷 기업의 주요 사업 영역은 PC 웹과 모바일 앱에 집중되어 있었다. PC와 스마트폰의 대중화로

대부분의 공간과 시간의 이용자는 이미 포괄하고 있다.

그러나 인터넷 기업이 아직 정복하지 못한 생활 영역이 있다. 대표적으로 ‘운전 중인 자동차’와 ‘집

거실’ 등이다. 이 영역에 대한 접근이 인공지능이 적용된 ‘음성 인식 스피커’, ‘자동차 인포테인먼

트’, ‘자율주행’ 등의 방식으로 전개되고 있다.

음성 인식 관련 인공지능 기술은 인터넷 기업 입장에서 단기적으로 오프라인 공간에 대한 추가적인 침

투를 촉진하고, 중장기적으로 ‘자동차’ 영역으로 진입할 수 있는 열쇠로 해석이 가능하다. 특히 주행 중

차량에서 ‘오디오’ 사용량이 많고 음성 인식 기술의 활용 가능성이 풍부하기 때문이다.

그림 26. 주요 장소에서 모바일 기기 외에 ‘오디오 기기’ 이용 비중 큰 것 부각

주: 2016년 국내 조사 기준, 자료: KISDI, 미래에셋대우 리서치센터

그림 27. 교통 장소에서의 오디오 이용 비중은 6년 전 대비 현저히 증가된 점 주목

주: 국내 조사 기준, 자료: KISDI, 미래에셋대우 리서치센터

0

20

40

60

80

100

집/직장

/학교 등

여가시설/서비스/기타 교통

(%)

공간 미디어

게임기

비디오 기기

오디오 기기

촬영 기기

전화기

컴퓨터

TV

종이 매체

0

10

20

30

40

50

60

집/직장

/학교 등

여가시설/서비스/기타 교통

(%)

2010년 오디오

2016년 오디오

2010년 모바일

2016년 모바일

Page 23: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 23

2) 통번역 기술은 차세대 서비스의 필수 부품으로 부상

인터넷 기업의 인공지능 인식 기술과 번역 기술, 표현 기술 등의 총합이 활용되고 있는 곳은 ‘통번

역’ 분야가 대표적이다. 특히 음성 인식과 합성이 기본적으로 활용되고 있는 점이 주목된다. 가장

직관적인 커뮤니케이션인 ‘자연어’, 인간이 일상적으로 사용하는 언어에 관한 분야이기 때문이다.

NAVER의 통번역 앱 파파고(Papago)는 인공신경망, 즉 딥러닝 방식을 채택했다. 과거의 통계 기

반 번역(SMT: Statistical Machine Translation)보다 인공신경망 번역(NMT: Neural Machine

Translation)이 좀 더 진화한 방식이고, 품질이 향상된 편이다.

인공신경망 번역은 구(Phrase) 단위가 아니라, 문장 전체 정보를 바탕으로 번역을 한다. 문장 전체

안의 구성 요소들을 변환하고 해석하는 방식이다. 문장 안에서 단어의 순서, 의미, 문맥에 따른 의

미 차이를 반영하여, 보다 효율적이고 정확하게 번역할 수 있다.

특히 통번역 기술은 다른 서비스들과 융합되어 해당 서비스의 가치를 높여주는 부품의 성격으로

간주될 수 있다. 통번역에 쓰이는 인식 기술, 표현 기술은 입력과 출력의 기능이기 때문에 다른 인

공지능 분야에도 충분히 활용될 수 있기 때문이다. 통번역 기술이 모바일 앱을 넘어, 웨어러블 기

기나 로봇, 자율주행 무인 택시, VR 기기 등과 결합된다면 새로운 시장도 형성될 수 있을 것이다.

그림 28. NAVER의 인공신경망 통번역 서비스 ‘파파고(Papago)’

자료: NAVER, 미래에셋대우 리서치센터

그림 29. 통번역 앱에 필요한 기술 3가지: 인식, 기계번역, 음성 합성

자료: NAVER, 미래에셋대우 리서치센터

Page 24: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

24 Mirae Asset Daewoo Research

2. 인공지능 스피커의 대중화

인터넷 기업의 인공지능을 통한 플랫폼 사업의 확대 초기에 음성 인식 스피커가 대두되고 있다. 이

로 인한 인터넷 서비스 측면에서의 주요 사업 기회는 다음과 같다.

1) 하드웨어 매출 발생

음성 인식 인공지능이 탑재된 스마트 스피커 등 하드웨어 기기 판매 매출이 발생할 수 있다. 단발성

이 아닌, 교체 수요까지 이어지려면 장기적으로 고객 유지가 가능한 구독, 독점 서비스 등이 필요할

전망이다. Amazon의 Prime 멤버십, NAVER와 카카오의 음악 구독 서비스 등이 대표적이다.

2) 상거래 매출 증가

음성 명령을 통한 상품 판매, 거래 수수료 매출이 발생할 수 있다. 주문으로 연계되는 쇼핑, 음식

배달, 식당 예약, 지역 검색 기능 등 생활 밀착형 서비스가 필요하다. NAVER는 쇼핑윈도/예약/페

이 등의 주요 상거래 솔루션을 갖추었고, 2017년 10월에는 ‘배달의민족’ 음식배달 서비스로 유명

한 기업 ‘우아한형제들’에 350억원을 투자했다. 카카오는 장보기/주문하기, LINE도 쇼핑/배달 등

의 서비스를 보유하고 있다. 상거래 서비스는 음성 인식 스피커의 주요 기능으로 연계될 전망이다.

그림 30. 국내 인터넷 기업의 첫 인공지능 스피커 NAVER의 ‘웨이브’ 그림 31. NAVER의 라인프렌즈 디자인 적용한 인공지능 스피커 ‘프렌즈’

자료: NAVER, 미래에셋대우 리서치센터 자료: NAVER, 미래에셋대우 리서치센터

그림 32. 카카오의 인공지능 스피커 ‘카카오미니’ 그림 33. 카카오미니 등 인공지능 스피커의 초기 기능은 ‘음악’ 강조

자료: 카카오, 미래에셋대우 리서치센터 자료: 카카오, 미래에셋대우 리서치센터

Page 25: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 25

3) 제휴 저변 확대

외부에 생태계를 개방하여 인공지능 플랫폼을 활용하게 한다면, 파트너 기업이 늘어나면서 제휴

매출이 증가할 수 있다. 특히 인공지능 플랫폼 자체가 ‘앱스토어’처럼 변모할 수 있다. Amazon도

음성 인식 스피커 ‘Echo’가 소비자에게 인기를 거두면서 클라우드 기반의 인공지능 ‘Alexa’ 서비

스도 발달했고, ‘Skill’이라고 불리는 음성 인식 애플리케이션 생태계도 팽창했다. Amazon의 스킬

스토어에 등재된 스킬 수는 2017년 2만 개에 근접하고 있다.

4) 클라우드 매출 성장

인공지능은 음성 인식을 통해 데이터를 확보하고, 지속적으로 학습하여 인식률이 향상되고 기능이

추가되기 때문에 클라우드와의 연계가 필수적이다. 이용자에 맞는 기능을 추가하고, 음악 취향 설

정 등 맞춤 서비스를 위해서도 클라우드 저장 공간의 활용이 필요하다.

인터넷 기업의 음성 인식에 연계된 인공지능은 매출원 자체가 아니라, 서비스이자 인터페이스로

간주할 필요가 있다. 인공지능은 이용자들에게 필요한 서비스를 제공하는 역할을 할 뿐, 관련된 과

금과 매출원은 클라우드에 연계되어 있는 구조이다.

Amazon의 클라우드 사업은 인공지능 시대 이전에도 존재했다. 그러나 당시 규모도 작았고, 성장

률도 낮은 편이었다. 2014년 3분기 클라우드 사업인 AWS가 포함된 사업은 기타 부문으로 불리

며 클라우드 사업이 따로 구분되어 있지도 않았고, 분기 매출액은 14억 달러 정도에 그쳤다.

Amazon은 인공지능 음성 인식 서비스 ‘Alexa’가 2014년 11월에 출시된 이후 클라우드 매출의 성장이

더욱 가속화된 것으로 추정된다. 2017년 3분기의 AWS 매출액은 46억 달러를 기록했으며, 3년 만

에 3배가 넘게 성장했다.

외부 기업이 아마존에 스킬을 등록하려면 무조건 아마존 클라우드를 써야만 한다. 스킬에 활용되

는 클라우드는 AWS의 ‘람다(Lambda)’라는 상품이다. 람다는 서버 관리 없이 코드를 실행할 수

있는 클라우드 서비스로서, 개발자가 스킬 코드를 업로드하면 사용자가 실행한 시간만큼 밀리세컨

드(1000분의 1초) 단위로 과금되는 구조이다.

그림 34. NAVER의 인공지능 플랫폼 Clova는 클라우드 기반으로 작동 그림 35. Amazon의 음성 인식 애플리케이션 Skill과 클라우드 연계 구조

자료: NAVER, 미래에셋대우 리서치센터 자료: Amazon, 미래에셋대우 리서치센터

Page 26: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

26 Mirae Asset Daewoo Research

3. 음성 커머스 시대의 개화

인공지능이 탑재된 음성 인식 스피커는 여러 기능을 제공해줄 것이지만, 그 중에서도 커머스 기능

이 가장 중요하게 부각될 것이라고 판단된다.

이미 모바일 비주얼 인터페이스 상에서 ‘간편결제’의 보급으로 결제 절차가 간소화되었고, 음성 명

령을 통해서는 해당 결제가 더 직관적으로 재빠르게 실행될 수 있게 된다. 미국에서의 2017년 4

월 조사에 따르면, 2017년에 전체 미국 성인 중 8% 정도가 음성 결제를 경험했고 5년 뒤인 2022

년에는 약 30%까지 음성 결제를 수용할 것이라는 전망이 나오고 있다.

커머스 매출은 지속성과 규모 측면에서도 부각될 가능성이 높다. 생필품 등 정기적으로 고민 없이

사야 되는 제품의 경우는 모바일 화면에서 클릭하거나 전화 주문을 하는 등의 절차도 이제 귀찮게

느껴질 것이다. 음성 명령을 통해 간단히 주문하거나, 명령 없이도 알아서 배달이 되는 구독형 서

비스로 변화할 것이다. 또한 실물의 구매가 수반되는 커머스는 매출 규모 측면에서 음악 등 무형의

서비스 매출보다 클 수 있다.

특히 가상 비서(Virtual Assistant)의 여러 형태 중 ‘음성 인터페이스’의 형태가 가장 소비자에게

가치 있는 형태로 수용되고 있다는 점에 주목된다. Amazon의 Echo도 현재 기능 이용률 중 물건

구매나 쇼핑 리스트 추가 등 쇼핑과 관련된 이용률이 상당히 높은 편이다.

그림 36. 인공지능 탑재된 음성 인식 스피커를 통한 상품 주문 및 결제 보편화 추세 전망

주: 미국 성인 기준 전망치

자료: BI Intelligence, 미래에셋대우 리서치센터

그림 37. Amazon의 Echo 등 인공지능 기기 판매의 장기 목적은 결국 ‘음성 쇼핑 대중화’

자료: Amazon, 나스미디어, 미래에셋대우 리서치센터

0

10

20

30

40

0

20

40

60

80

100

2017 2018F 2019F 2020F 2021F 2022F

(%)(백만명)

음성 결제 이용자 수 (L)

음성 결제 이용자 비율 (R)

Page 27: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 27

음성 커머스의 초기 단계가 선호가 중요하지 않은 생필품 구매 수준이라면, 그 다음 단계는 취향

선호가 분명한 패션 영역이 될 수 있다. 미국의 신규 상장 기업 Stitch Fix가 대표적인 사례이다.

Stitch Fix는 2017년 매출 9.7억달러에 영업이익 3,164만달러를 기록했다. 기존의 커머스가 다양

한 상품과 빠른 배송을 강점으로 내세웠다면, Stitch Fix는 철저히 소비자에게 맞춘 소량의 공급을

지향한다. 미디어나 커머스의 기존 문법이 Broadcasting, 대중을 위한 것이었다면 향후의 문법은

Narrowcasting, 개인을 위한 것으로 바뀌고 있는 것이다.

Stitch Fix의 패션 추천은 인공지능과 인간 스타일리스트의 결합에 기반한다. 넷플릭스의 데이터

분석 담당 부사장 출신이 현재 Stitch Fix의 최고 알고리즘 책임자(CAO)를 맡고 있다. 해당 팀이

소비자의 선호 스타일, 패션 트렌드 등을 고려하여 알고리즘을 만들어 적용하고 있다. 이미지 인식

기능을 통해 말로 설명하기 어려운 취향도 데이터로 변환하여 활용한다.

음성 인터페이스와 인공지능 패션 알고리즘이 결합되면, “다음 주 베스트 프렌드의 결혼식에 입고

갈 옷 주문해줘” 같은 간단한 명령어로 내가 원했던 옷이 몇 일 사이에 배송될 수 있을 것이다. 소

비자가 정보 과잉의 시대에 불필요한 것을 보지 않고 정말 만족하는 답을 바로 얻을 수 있다면, 서

비스 이용 시간 대비 매출이 극대화될 수 있다.

그림 38. 미국 신규 상장 기업 Stitch Fix는 인공지능 패션 유통 사업 중

자료: Stitch Fix, 미래에셋대우 리서치센터

그림 39. Stitch Fix는 스타트업으로는 드물게 영업이익을 기록 중

자료: Stitch Fix, 미래에셋대우 리서치센터

-250

0

250

500

750

1,000

2014 2015 2016 2017

(백만달러)

매출

영업이익

Page 28: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

28 Mirae Asset Daewoo Research

4. 인터넷 엔진은 '검색'에서 '추천'으로 전환

음성 인터페이스와 인공지능의 결합으로 인해 인터넷 플랫폼의 기존 작동 엔진도 변화할 것이다.

기존의 주요 엔진은 통계에 기반한 ‘검색’ 및 노출 메커니즘이었다. 그러나 음성 인터페이스가 대중

화된 시대의 차세대 엔진은 인공지능에 기반한 ‘추천’ 및 큐레이션 메커니즘이 대두될 전망이다.

추천 엔진의 등장 이후 시나리오를 극단적으로 그려본다면, 검색 광고 시장에 위협이 될 수도 있

다. 기존의 시각 인터페이스에서의 검색 광고의 원리는 검색어 입력 이후 뜨는 수많은 검색결과 중

에서 상위에 노출되기 위한 지불이었다. 그러나 음성 인터페이스에서는 음성 명령 이후 수많은 결

과를 나열할 수 없기 때문에 광고가 끼어들 여지가 없어질 수 있다.

그러나 합리적인 시나리오는 상호 보완성, 가중치 적용 등을 고려할 수 있다. 음성 인터페이스가

대중화되더라도 해당 인터페이스의 물리적 한계 때문에 시각 인터페이스와 보완적으로 기능할 가

능성이 높다. 또한 여러 결과값의 여지가 없어지는 대신, 추천 이후 따라붙는 몇 개의 광고 슬랏을

차지하기 위해 해당 슬랏의 단가가 굉장히 높아질 수 있다고 본다.

또한 음성 인터페이스의 대두로 인해 인터넷 기업들 간의 서비스 품질에 따른 매출 격차는 가속화될 전

망이다. 소비 경험에 있어 음성 인터페이스의 직관성과 인공지능 엔진의 정교함 등이 더욱 중요해

질 것이기 때문이다. 인내심이 극도로 낮아진, 그러나 높은 만족을 원하는 소비자에게 제대로 된

추천을 해 줄 수 없다면, 고객 경험이 훼손되어 서비스 충성도가 현저히 낮아질 가능성이 높다. 반

면에 좋은 고객 경험을 제공해주고, 머신 러닝을 통해 지속적으로 매일 좀 더 나은 경험을 제공해

줄 수 있는 서비스라면 고객의 충성도는 향상되어 높은 진입장벽을 쌓을 수 있을 것이다.

그림 40. 음성 인식과 인공지능의 도입으로 검색 외에 ‘추천’ 인공지능 엔진의 중요성 증대

자료: 미래에셋대우 리서치센터

그림 41. NAVER의 인공지능 기반 개인화 상품 추천 시스템 ‘AiTEMS’ 구조

자료: NAVER, 미래에셋대우 리서치센터

<입력>

텍스트

이미지

오디오

자연어

음성

대화

시스템

검색

정답/추천

엔진

커머스

<출력>

텍스트

이미지

음성

오디오

비디오

인공지능 영역

Page 29: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 29

5. 플랫폼으로서의 자동차 부각

인터넷 기업의 음성 인터페이스 도입을 통한 중장기적인 사업 방향은 자동차를 향할 전망이다. 인

터넷 기업이 음성 인식 스피커와 관련 인공지능 기술을 다루는 것은 ‘자동차’ 영역으로 진입하는

관문이라고 할 수 있다. 주행 중 차량 내에서의 음성 인식 기술의 활용도가 높기 때문이다.

인터넷 기업들은 자동차에 대해 ‘포스트 스마트폰’의 개념으로 접근하고 있다. 자율주행 시대가 된

다면, 자동차 자체가 플랫폼으로서 정보를 주고받는 역할을 할 수 있기 때문이다. 이미 어디서나

정보에 쉽게 연결되는 시대가 도래했지만, ‘도로 위 운전석’만은 여전히 예외였다. 텍스트 입력이나

터치 등의 인터페이스에 한계가 있었기 때문이다. 그러나 음성 인터페이스를 통해 좀 더 즉각적이

고 편리한 서비스를 누리는 것이 가능해질 전망이다.

‘서비스로서의 교통(Mobility as a Service)’은 이미 우버나 카카오 등의 인터넷 기업들이 주도하고

있다. 카카오의 ‘카카오 T’는 택시, 대리운전, 주차, 내비게이션 등의 교통 서비스를 종합적으로 제

공한다. 핀란드 기업 MaaS Global은 ‘Whim’ 서비스를 통해 헬싱키의 택시뿐 아니라 버스 및 기

차, 렌터카와 오토바이 등의 다양한 교통 수단을 통합하여 월정액 요금제 형태로도 제공하고 있다.

향후 ‘서비스로서의 자동차’는 ‘자율주행 자동차 네트워크’로 통합될 전망이다. 사람은 이제 ‘운전

자’가 아닌 ‘사용자’로만 바뀔 것이며, 통합 교통 서비스에 대한 수요는 더욱 늘어날 전망이다.

그림 42. 카카오 모빌리티의 자동차 서비스 ‘카카오 T’

자료: 카카오, 미래에셋대우 리서치센터

그림 43. 핀란드 MaaS Global의 통합 교통 월정액 서비스 ‘Whim’

자료: MasS Global, 모바일 트렌드 2018, 미래에셋대우 리서치센터

Page 30: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

30 Mirae Asset Daewoo Research

자율주행 시대의 자동차는 다양한 의미를 가질 것이다. ‘운송 수단’이면서, ‘스마트 단말’, ‘나만의

공간’ 등으로 부상된다. 자동차의 의미가 확대되면서 새로운 사업 기회도 생기고 있다. 이용자들이

자동차에서 느낄 수 있는 가치는 더욱 커질 전망이다.

완전 자율주행차에서는 사람이 운전에서 해방될 것이므로, 사람은 운전 외에 다른 것을 할 수 있는

새로운 시간이 생기게 된다. Google도 ‘이 시간을 어떻게 보내게 할 것인가’에 대한 고민이 자율

주행차를 개발하게 된 동기가 되었다고 한다. 자동차를 타고 이동하는 시간 자체가 새로운 수익을 얻

게 되는 기회로 작용할 수 있다.

현재도 자동차에서 이미 다양한 미디어 콘텐츠 서비스를 이용할 수 있다. 그러나 운전자는 주행 중

스마트폰 사용이 물리적으로 쉽지 않고 교통법규 위반에도 해당하여 한계가 있다. 자율주행 시대

에 접어들면 운전자나 동승자에게 차량의 스크린을 통해 동영상 콘텐츠를 제공하는 서비스가 추가

될 수 있다. 자동차 스스로 이동 경로와 목적지에 도착하기까지의 시간을 알기 때문에 해당 장소

맥락과 이동 시간 길이에 맞는 콘텐츠를 추천할 수도 있고, 타겟 광고를 제공하는 것도 가능해진

다. NAVER가 인포테인먼트 ‘AWAY’를 개발하여 연말부터 애프터마켓에 판매를 하는 것, 장차 완

전 자율주행차 단계를 위한 기술 연구를 하는 것도 이러한 부분 때문이라고 판단된다.

그림 44. 네이버랩스의 자동차 인포테인먼트 ‘AWAY’

자료: NAVER, 미래에셋대우 리서치센터

그림 45. 네이버랩스의 자율주행차 시험 운행 차량

자료: NAVER, 미래에셋대우 리서치센터

Page 31: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 31

IV. 콘텐츠 산업의 확대

1. 음성 인식을 통해 확대되는 콘텐츠 소비

편의성 개선으로 콘텐츠 소비 자극

TV, 모바일 등 콘텐츠 관련 전자 기기 조작은 음성 인터페이스를 통해 크게 편리해질 전망이다. 음

성 명령은 기기 인식까지 필요한 조작 횟수가 적고 소요 시간도 짧다. 단적인 예로 VoD 시청(각

주문형 비디오 서비스 이용해 ‘비밀의 숲’ 1화 재생 가정)을 들 수 있다. 명령 입력을 위해 필요한

조작은 아이패드 넷플릭스 앱(터치 입력) 구동 시 18회, 올레tv 셋탑(리모콘 버튼 입력) 이용 시

24회이고, ‘누구’ 스피커 연동 Btv(음성 입력)에서는 단 2회에 불과하다.

이 같은 편의성 개선은 콘텐츠 전반에 대한 접근성을 높여주어 콘텐츠 소비를 자극한다. 음성 인식을

통한 VoD 이용은 모바일 기기의 한계(작은 화면)와 TV의 단점(검색 불편함)이 모두 해결된 경우

다. 이에 더해 장기적으로 음성 인식률이 높아지면 구매 과정이 더욱 단순해지고, 데이터 활용으로 콘

텐츠 추천 정확도가 상승하면 실 구매율이 높아진다. 콘텐츠 소비 증가로 이어지기 좋은 환경이다.

그림 46. 음성 인식 도입은 콘텐츠 소비를 자극하고 미디어 환경 변화를 가속할 것

자료: 미래에셋대우 리서치센터

그림 47. 기가지니(스피커) 이용 시 콘텐츠 소비 증가 그림 48. 음성 인식 스피커의 조작 편의성이 월등히 좋다

자료: KT, 미래에셋대우 리서치센터 자료: 미래에셋대우 리서치센터

0

50

100

150

200

250

300

350

시청시간(일평균) VOD 시청시간(일평균)

UHD

GiGA Genie

(분) UHD 대비

GiGA Genie TV는

+16.4% 초과 시청

UHD 대비

GiGA Genie

주문형 비디오는

+36.4% 초과 시청 0

5

10

15

20

25

30

아이폰

터치

올레tv

리모컨

Nugu

스피커

아이폰

터치

PC

마우스,

키보드

Nugu

스피커

(회)

VoD와 음원 재생을 위한

입력 횟수는

음성 인식 스피커에서

월등히 작음

Page 32: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

32 Mirae Asset Daewoo Research

미디어 가용 시간을 늘리는 음성 인터페이스

음성 인식은 모든 매체에서 ‘핸즈프리’를 가능케 한다는 특징이 있다. 손이 자유롭지 않은 상황에

서도 이용이 가능하다는 것은 곧 미디어 가용 시간이 늘어남을 의미한다. 실제로 아마존 에코 이용

자의 가정 내 이용 장소 1위는 ‘부엌’이다. 부엌은 멀티태스킹이 필요한 대표적인 공간이다. 실제

기기의 사용도 타이머 설정, 음악 재생, 뉴스 청취 등으로 기존에 ‘죽어 있던’ 시간의 미디어 이용

을 암시한다. 이는 주행 중인 차량 내에서 음성 인식의 유용성이 주목 받는 것과 같은 맥락이다.

콘텐츠는 필수 소비재가 아닌 선택적 소비재다. 여가 시간을 채우는 수단 중 하나로서, 필요성보다는

기호에 따라 소비가 결정된다. 따라서 이용 편의성이 전체 소비량에 심대한 영향을 미친다. 이는

미디어 소비 시간이 신매체 출현과 함께 증가해온 과거 사례에서 증명된다.

PC와 인터넷 출현으로 ‘콘텐츠 저장’이 가능해지면서 미디어 이용 시간대가 유연해진 것, 모바일

인터넷 등장으로 미디어 이용에 ‘기동성’이 더해진 것 모두, 미디어 이용 불가 시간이 가용 시간으

로 전환된 사례다. 음성 인터페이스가 또 한번 가용 시간을 늘릴 것으로 예상하는 바, 소비량 증가에

이어 콘텐츠 사업 모델(직접 판매 > 디지털 광고 > TV 광고) 전반에 기회가 있을 것으로 판단한다.

그림 49. 모바일 인터넷 디바이스 출현으로 미디어 소비 시간 증가 그림 50. 신규 디바이스 출현이 전체 뉴스 소비 증가를 자극

주: 미국 성인 기준

자료: eMarketer, 미래에셋대우 리서치센터

자료: PEW Research, eMarketer, 미래에셋대우 리서치센터

그림 51. 아마존 에코(음성 인식 스피커) 이용 장소 1위는 ‘부엌’ 그림 52. 아마존 에코(음성 인식 스피커) 주 이용 부문 조사

자료: Creative strategies, 미래에셋대우 리서치센터 자료: Statista, 미래에셋대우 리서치센터

350

450

550

650

750

2008 2011 2016

기타 인터넷 디바이스

PC

모바일

전통매체

(분) 2016년 미디어 소비 시간은

2008년 대비 +14%

0

10

20

30

40

50

60

부엌 거실 가족실 침실 기타 식당 화장실 지하

(%)

0

15

30

45

60

75

90

타이머

설정

음악 재생 뉴스 청취 조명 조작 쇼핑 음원

서비스

연결

(%)

0

30

60

90

1996 2000 2004 2008 2012 2016

온라인 신문

라디오 TV

(분)

66

59

79

2016년 전체 뉴스 소비 시간은

1996년 대비 +19%

2002년 대비 +33%

Page 33: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 33

2. 음성 인식은 3가지 미디어 트렌드를 강화

콘텐츠 위상 변화: 광고 보조 역할 유료 판매 상품

기존에는 플랫폼 중심이었던 영상 밸류체인에서 콘텐츠의 위상이 높아지고 있다. 콘텐츠가 발생시

키는 두 가지 매출인 ‘광고’와 ‘직접 판매’ 중 성장의 축도 전자에서 후자로 이동 중이다. 전체 광고 시

장 성장은 GDP 성장에 수렴하며 둔화되는 반면 콘텐츠에 대한 지불 용의는 지속 증가해왔기 때문

이다. 넷플릭스(시즌별 일시 공개)에서 비롯된 ‘몰아보기’ 문화가 국내로 퍼진 영향도 참고할 만하

다. 이는 개별 회사 매출액 구성에서도 드러난다. CJ E&M의 전통 수익 모델인 국내 방송 광고 및

수신료 성장률 – 국내외 콘텐츠 판매 증가율, 쇼박스의 국내 극장 매출액 성장률 – 국내 부가판권

매출액 증가율 각각은 최근 4년간 연평균 20%p 내외의 큰 차이를 보였다.

고성장 중인 유료 콘텐츠 시장은 추가 성장 여력도 높다. 범위를 인터넷 기반 플랫폼으로 한정하면

명확히 드러난다. 한국은 빠르게 성장한 인터넷 광고 시장 대비 인터넷 유료 비디오 시장 규모가

아직 매우 작은 수준이다. 국산 OTT 성과가 저조했고, 넷플릭스(2016년 1월)와 아마존(2016년

12월) 등 글로벌 유력 사업자의 한국 진출이 비교적 늦게 시작된 영향이다. 이들의 로컬 콘텐츠 확

보가 이제 막 시작된 시점, 음성 인식 스피커는 각종 플랫폼과 송출 기기의 손쉬운 연결을 지원해 콘텐

츠 판매를 더욱 촉진할 수 있다.

그림 53. 가입자 정체에도 주문형 비디오(VoD) 증가세는 뚜렷 그림 54. 국내 인터넷 비디오 성장 여력이 높다

자료: 방송통신위원회, 미래에셋대우 리서치센터 자료: PwC, 미래에셋대우 리서치센터

그림 55. 과거 영화 VoD 매출액 증가가 구매체(비디오) 퇴출을 상쇄 그림 56. CJ E&M과 쇼박스의 부문별 매출액 연평균 성장률

자료: 영화진흥위원회, 미래에셋대우 리서치센터 자료: CJ E&M, 쇼박스, 미래에셋대우 리서치센터

0

200

400

600

800

2014 2015 2016

IPTV

위성

MSO

(십억원)

CAGR = 11.2%

0

6

12

18

24 인터넷 광고 시장 대비 유료 비디오 시장 규모(%)

전세계 = 11.2%

(%)

전세계 = 11.2%

-60

-40

-20

0

20

40

60

2005 2007 2009 2011 2013 2015

부가판권 매출액 성장률

한국영화 투자수익률

(%)

비디오(VHS)

시장 퇴출

VoD, 수출확대

1.9

22.5

6.8

25.2

0

5

10

15

20

25

30

방송 광고,

수신료

콘텐츠 판매 영화관 국내 부가판권

CJ E&M (2013~2017) 쇼박스 (2012~2016)

(%)

Page 34: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

34 Mirae Asset Daewoo Research

TV 채널 의존도 하락

기존 콘텐츠 플랫폼의 존재 가치는 콘텐츠 소비의 매개로서 공급자와 이용자 각각에 접근성을 열

어준다는 점이었다. 따라서 방송 사업에서 플랫폼(채널)의 우열은 곧 접근성의 높고 낮음에 의해

정해졌다. TV를 예로 들면 접근성의 차이는 곧 채널 번호다. 대체로 낮은 채널 번호를 차지하는 지

상파가 높은 채널 번호를 부여 받는 종편/케이블보다 좋은 플랫폼으로 인정받는 것(광고 단가 차

이)도 이 때문이다.

음성 인식 스피커가 주 입력 수단이 되면 접근성 측면에서 플랫폼(채널) 간 차별성이 어느 정도 약

해진다. 기존에는 TV 리모콘의 ‘위/아래 채널’ 버튼이 주로 이용됨에 따라 채널이 가진 번호가 중

요했지만, 조작이 간편한 음성 인터페이스는 채널 간 이동 시 채널 번호가 가지는 의미를 퇴색시킨다.

채널 선택 과정에서 접근성이라는 변수는 덜 중요해지고 콘텐츠 선호 자체는 더 중요해지는 것이다.

이로 인해 현재 접근성이 낮은 곳으로부터 상대적 수혜를 볼 가능성이 높다. TV 방송에서는 후순

위 채널, 음원은 Top 순위에 들지 못하는 비인기 음원에 대한 접근성이 상대적으로 나아진다. 닿

기 쉬운 콘텐츠보다 경쟁력 있는 콘텐츠가 주목 받을 수 있게 된다.

그림 57. 채널 당 광고 시장 규모는 여전히 지상파가 압도적

자료: KOBACO, 제일기획, 미래에셋대우 리서치센터

그림 58. 기가지니 이용 시에 높게 나타나는 비주류 음악 점유율: 이용 행태 변화에 기인

자료: KT, 미래에셋대우 리서치센터

0

50

100

150

200

250

300

지상파 종편 CATV

(십억원)

가요, 54

가요, 76

클래식, 5

동요/태교, 20

0

20

40

60

80

100

기가지니 지니앱

동요/태교 클래식 재즈 POP OST 가요(%)

Page 35: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 35

니치 콘텐츠(MCN, 보이스) 기회 확대

디지털 광고 시장 성장으로 인해 미디어 업종이 분자화되고 있다. 한정된 대상에 대한 어필만으로

도 수익 창출이 가능해지면서 산업의 기본 작동 원리도 바뀐 것이다. 콘텐츠는 기존 Broad-casting

영역, 즉 대중을 위한 것에서 Narrow(micro)-casting, 지역/계층/취향이 한정된 시청자를 위한 것으로

차츰 변하고 있다. 케이블TV 개국으로 인한 각 채널 포지셔닝 세분화가 그 출발이었고, 최근 팟캐

스트/아프리카tv/유튜브 등 개인 방송 플랫폼이 성장하며 이행 속도가 빨라졌다.

음성 인식 스피커는 이용자별 콘텐츠 추천 제공과 더불어, 니치 콘텐츠에 대한 접근성을 높여준다. 기존

의 콘텐츠 다양화 흐름을 가속화할 수 있다. 한편 가족 단위의 공동 사용이 많다는 점도 기존 비주

류 콘텐츠에 기회 요인으로 볼 수 있다. 기가지니를 통한 음원 이용은 지니앱보다 가요 장르 집중

도가 낮은 반면, 동요/태교 등 기존 비주류 장르 인기는 상대적으로 높게 나타난다.

1) 광고 매체로서 개인 방송 경쟁력이 지속 부각될 것이다. 개인 방송은 디지털 매체 호조와 타겟팅

가치 평가라는 광고 시장 흐름에 잘 부합한다. 인터넷 콘텐츠는 전통 매체 콘텐츠보다 소재와 포맷

이 다양하고 자유롭다. 실생활에 가깝고 개인적인 내용을 담는 경우가 많으며 타겟으로 설정하는

소비층 범위는 결코 넓지 않다. 결국 이용자가 느끼는 친밀감에 기반해 콘텐츠 선택 자체가 셀프-타겟

팅 기능을 하게 된다. 광고에 대한 거부감은 낮고, 구매 가능성은 높아 경쟁력 있다.

기업들은 개인 크리에이터에게 각종 제작 환경을 지원하고 수익을 배분 받는 ‘MCN’ 비즈니스로

산업 성장에 대응하고 있다. 일종의 특화된 디지털 마케팅 에이전시 격이다. 최근에는 영상 클립

광고뿐 아니라 직접적인 상품 노출(DIA TV 브랜디드 패키지)을 기획해 높은 광고 효과를 내도록

돕는다. 드라마에서의 PPL과 유사하다.

국내 MCN 업계에서는 특히 뷰티와 키즈 장르 채널이 각각 화장품, 캐릭터/장난감 사업으로 성공

적인 확장을 진행 중이다. 장르 특성 상 시연 성격을 띠게 되어서 구매까지 연결되는 경우가 많고,

이 때문에 광고 부문에서 가장 성공적인 장르가 된 것으로 파악한다. 한편 MCN이 발달한 미국에

서는 개인 방송 영향력이 막강해지면서 이 부문에서도 수익 모델이 다변화되고 있다. MCN 업계

상위 플레이어 일부는 단순 광고 수익 공유에서 나아가 콘텐츠 자체를 플랫폼별로 단독 공급한다.

개인 방송 콘텐츠도 높은 가치로 평가 받을 수 있다는 점이 드러난다.

그림 59. 진정한 ‘네이티브 광고’로서 효율이 높은 MCN 콘텐츠 그림 60. DIA TV 영향력 강화

자료: Youtube, 미래에셋대우 리서치센터 자료: 언론 자료 종합, 미래에셋대우 리서치센터

0

20

40

60

80

100

120

0

200

400

600

800

1,000

1,200

1,400

1,600

15.5 15.11 16.5 16.11 17.5

월 조회수 (L)

누적 구독자수 (R)

(십억회) (백만명)

Page 36: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

36 Mirae Asset Daewoo Research

2) 보이스 콘텐츠에 대한 수요가 늘어날 것으로 본다. 음성 인식 스피커로 생활 속에 음성이 침투함

에 따른 자연스러운 변화다. 라디오/E-book/팟캐스트 등의 플랫폼에서 유통되어 온 보이스 콘텐

츠는 음성 인식 스피커와 결합해 뉴스/날씨/교통/시사/서적 등 다양한 분야에 적용될 전망이다.

특히 1인 가구에 대해서는 집안의 적막함을 줄여주는 기능도 중요해지는데, 사람 목소리를 한 비

서 역할의 연장선에서 보이스는 적절한 콘텐츠 형태다. 혼자 있는 집에서 무심코 켜놓게 되는 기기

는 TV에서 스피커로 서서히 바뀔 수 있다.

이러한 맥락에서 다수 사업자들이 음성 콘텐츠 확보에 나서고 있다. 특히 ‘음성 MCN’이 기대되는

분야다. 기존 모바일, PC 네트워크 발전에 힘입어 동영상 MCN이 신산업으로 자리매김한 것과 같

은 이치다. 스피커 등장과 함께 오디오 콘텐츠가 주목 받는 현 시점 다채로운 오디오 콘텐츠와 크

리에이터들이 등장할 차례다. 음성 MCN은 시각적 노출이 없어 크리에이터들의 진입 장벽이 낮고,

외적인 요소보다 내용 자체에 대한 집중도가 높아 정제된 콘텐츠 공급을 기대할 수 있다. 광고 기

반 스트리밍 서비스에서 확인했듯이 음성 정보에 붙는 짧은 토막 광고의 높은 효율도 공급자 입장

에서 매력적인 부분이다.

NAVER는 오디오 콘텐츠 플랫폼 ‘오디오클립’을 2017년 1월 출시해 콘텐츠 확보에 집중하고 있

다. 기존의 대표적 장르에서 벗어나 구연동화, 미술관/박물관 가이드, 외국어 강좌, 오디오포맷 잡

지 등 지식/교양에 특화된 전문가 방송 플랫폼을 지향한다. 실제로 동 프로젝트는 자사 AI 스피커

와 플랫폼 내 유통 콘텐츠 연동을 염두에 두며 시작됐고 해당 작업도 순조롭게 진행 중이다.

MCN 스푼라디오도 ‘일반인이 방송하는 라디오앱’으로 포지셔닝하며 다양한 음성 콘텐츠를 송출

한다. 아프리카tv의 라디오 버전으로 이해하면 적절하다. 웹툰을 보이스 포맷으로 변환한 오디오

툰, 이용자 참여형 콘텐츠 스푼톡 등이 대표적이다. BJ 후원하기(별풍선) 및 일부 유료 콘텐츠가

수익 모델이다.

그림 61. 개인 방송 네트워크 MCN의 수익 배분 구조

자료: 미래에셋대우 리서치센터

그림 62. 보이스 기반 니치 콘텐츠, 음성 MCN과 팟캐스트 주요 채널

자료: NAVER, 팟빵, 미래에셋대우 리서치센터

Page 37: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 37

3. 콘텐츠 제작 역량 부각

콘텐츠 브랜드 가치가 더욱 부각될 것

미디어 콘텐츠(광고 모델과 판매 모델) 전반에서 나타나는 공통된 트렌드는 ‘찾아보는 콘텐츠’의 가치가

높아지고 있다는 점이다. 유료 판매 콘텐츠는 물론이고, 광고에서도 마찬가지다. 이는 디지털 매체

고성장으로 2016년 이후 광고 부문 내 점유율 1위 매체가 방송에서 디지털로 바뀐 것과 관련 있

다. 시장 규모와 함께 방송 채널에서 일방적으로 편성/제공되는 콘텐츠는 중요성이 줄었다. 반면

소비자가 자의로 찾아내서 보는 유료 및 디지털 콘텐츠는 높은 성장성과 수익성을 보인다.

이 관점에서 디지털 플랫폼 점유율이 높은 사업자가 향후 경쟁 우위를 가져갈 가능성이 높다. 알짜 매

출액은 채널을 찾아가는 이용자보다 콘텐츠 메이커와 프로그램을 찾아가는 이용자로부터 나오는데

디지털 플랫폼 원리가 이에 부합하기 때문이다. ‘찾아보는 성격의 콘텐츠’ 식별은 1) 예능 프로그램

의 경우 각각의 숏클립 조회수를 통해 유추할 수 있으며, 2) 드라마의 경우 각 사업자의 VoD 매출

비중으로 짐작이 가능하다.

접근성 차등이 제거된 디지털 플랫폼(네이버TV 등)에서는 콘텐츠 경쟁력과 화제성이 오롯이 조회

수로 이어진다. 주차별 차이는 있지만 대체로 케이블/종편 유력 채널(tvN, Mnet, JTBC)의 디지털 조

회 점유율은 TV 시청 점유율에 비해 월등히 높다. 이들 콘텐츠 메이커에 주목이 요구된다.

그림 63. 방송보다 커진 디지털 광고 시장 그림 64. 디지털 매체의 성장률이 가장 높음

자료: KOBACO, 제일기획, 미래에셋대우 리서치센터 자료: KOBACO, 제일기획, 미래에셋대우 리서치센터

그림 65. TV 시청 점유율: 지상파가 여전히 높으나 그림 66. 디지털 클립 재생: 비지상파 유력 메이커 콘텐츠가 경쟁력 있음

주: 2017년 월간 시청률 평균치

자료: AGB Nielson, CJ E&M, 미래에셋대우 리서치센터

주: 2017년 8월 4주차 기준 NAVER TV Top 100 기준

자료: NAVER, 미래에셋대우 리서치센터

0

1

2

3

4 지상파 + 유료방송

지상파

디지털

(조원)

-6

-3

0

3

6

9

12

방송

전체

지상파 유료

방송

라디오 인쇄 디지털 옥외/

제작

최근 3개년 성장률 평균치

전체 시장 성장률= 2.9%

(%)

10

20

30

40

CJ E&M 계열 CJ E&M 제외

지상파 종편 케이블

(%)

0

10

20

30

40

tvN Mnet JTBC 유튜브 MBC KBS SBS 기타

(백만회)

Page 38: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

38 Mirae Asset Daewoo Research

콘텐츠 제작사의 다음 역할은 프로젝트 패키저(Project Packager)

‘검색’에서 ‘추천’으로 전환되는 인터넷 엔진과 유사한 변화가 콘텐츠 제작 단에서도 일어날 전망이다.

기존의 콘텐츠 소비는 탐색 및 재생 메커니즘이었다. 그러나 음성 인터페이스가 대중화된 시대의 차

세대 콘텐츠 소비는 인공지능에 기반한 ‘추천’ 및 큐레이션 메커니즘이 중요해질 것이다.

콘텐츠 관련 명령어와 이용 데이터가 축적되면서 국내에서도 흥행 가능성 높은 콘텐츠가 기획되는

경우가 많아질 것이다. 넷플릭스의 오리지널 콘텐츠 제작이 이용자 데이터 분석에서 시작됐음을

상기할 필요가 있다. 각 스피커 연동 플랫폼이 가진 직관성과 추천 엔진의 정교함이 중요해지는 국면

이다. 또한 제작사에는 기획형 프로젝트를 이끌어가는 패키저 역할이 요구된다.

다시 말해 콘텐츠 제작 업체의 역할은 ‘방송 채널의 프로그램 공급 하청 업체제작물의 IP 홀더이자

다채널향 능동적인 판매 업체데이터 분석에 입각한 콘텐츠 기획의 핵심 주체’로 진화 중이다. 준비된

소재와 감독, 출연자 등 참여 주체를 엮고, 구심점 역할을 하기에는 네트워크와 작업 여력이 풍부

한 대형사가 유리하다. 기획 콘텐츠라는 점이 유사한, 기존 IP 활용 영화 작품들에서도 유명 감독

들은 대형 배급사와 연속 작업하는 것을 선호했다. 이들에 대한 주목이 필요하다.

그림 67. 영화 산업에서도 배급사 역할 확대: 과거 단순 관리/유통 담당 기획-제작-유통 전반 관여

자료: 쇼박스, 미래에셋대우 리서치센터

표 6. 투자배급사와 주요 흥행 감독(300만 흥행작 3편 이상) 간 프로젝트 이력: 연속성이 있음 (백만명)

감독 배급사 개봉일 영화명 관객 수 감독 배급사 개봉일 영화명 관객 수

강우석 시네마서비스 2003-12-24 실미도 11.1 김성훈 쇼박스 2014-05-29 끝까지 간다 3.5

시네마서비스 2005-01-27 공공의 적 2 3.9 쇼박스 2016-08-10 터널 7.1

씨제이엔터테인먼트 2006-07-13 한반도 3.9 씨제이이앤엠 2017-01-18 공조 7.8

씨제이엔터테인먼트 2008-06-19 강철중: 공공의 적 1-1 4.3 김용화 쇼박스 2003-09-04 오! 브라더스 3.1

씨제이엔터테인먼트 2010-07-14 이끼 3.4 쇼박스 2006-12-14 미녀는 괴로워 6.6

봉준호 씨제이엔터테인먼트 2003-04-25 살인의 추억 5.3 쇼박스 2009-07-29 국가대표 8.5

쇼박스 2006-07-27 괴물 13 김지운 영화사청어람 2003-06-13 장화, 홍련 3.1

씨제이엔터테인먼트 2009-05-28 마더 3 씨제이엔터테인먼트 2008-07-17 좋은 놈, 나쁜 놈, 이상한 놈 6.7

씨제이이앤엠 2013-08-01 설국열차 8.9 워너브러더스 코리아 2016-09-07 밀정 7.5

최동훈 씨제이엔터테인먼트 2006-09-28 타짜 6.8 박찬욱 쇼이스트,씨제이이앤엠 2003-11-21 올드보이 3.3

씨제이엔터테인먼트 2009-12-23 전우치 6.1 씨제이엔터테인먼트 2005-07-29 친절한 금자씨 3.7

쇼박스 2012-07-25 도둑들 13 씨제이이앤엠 2016-06-01 아가씨 4.3

쇼박스 2015-07-22 암살 12.7 윤제균 씨제이엔터테인먼트 2009-07-22 해운대 11.5

강형철 롯데엔터테인먼트 2008-12-03 과속스캔들 8.2 씨제이이앤엠 2014-12-17 국제시장 14.2

씨제이이앤엠 2011-05-04 써니 7.3 이석훈 씨제이이앤엠 2012-01-18 댄싱퀸 4.1

롯데엔터테인먼트, 싸이더스 2014-09-03 타짜-신의 손 4 롯데엔터테인먼트 2014-08-06 해적: 바다로 간 산적 8.6

씨제이이앤엠 2015-12-16 히말라야 7.8

자료: 언론 종합, 미래에셋대우 리서치센터

Page 39: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 39

Top Picks 및 관심종목

NAVER (035420/매수) 검색, 커머스, 인공지능 – 삼각 편대로 공략

음성 검색의 시대 개화, 이용자 접점 증가

커머스 부문, 유통 밸류 체인의 완성

인공지능 적용으로 플랫폼 확대, 클라우드 매출로도 연결

SK텔레콤 (017670/매수) 핵심 애플리케이션 다 갖췄다

국내 최초 음성 인식 스피커 NUGU를 통한 성장 동력 확보

콘텐츠 및 커머스 영역으로의 서비스 확장 용이

기존 사업의 안정적인 수익성과 배당 매력 기반의 성장 가시성 부각

LG유플러스 (032640/매수) 홈 IoT 부문의 그룹 시너지 창출 기대

홈 IoT 및 콘텐츠 경쟁력을 통한 음성 인터페이스 시장 선점

홈 IoT 부문에서 LG전자와의 시너지 창출 기대

기존 통신 사업의 경쟁력 강화 역시 매력적

로엔 (016170/매수) 음성 인식 스피커를 통한 제 2의 성장기 진입

음성 인터페이스가 새로운 수요를 만든다

SK텔레콤과의 제휴 강도는 더욱 강화될 것으로 예상

투자의견 ‘매수’ 유지, 목표주가는 126,000원으로 상향 조정

CJ E&M (130960/매수) 우주가 나서서 돕고 있다

음성 인터페이스 도입 시 편의성 개선에 따라 미디어 소비 증가 예상

콘텐츠 판매 모델 강화, 지상파와 접근성 격차 해소, MCN 재조명 흐름으로부터 수혜 가능

중국을 포함한 다국가, 다채널향 판매 고성장 예상

알파벳 (GOOGL US) 음성 검색 시장 경쟁력 확보 예상

음성 검색의 확대는 구글에게 단기적 리스크

그러나, 음성 검색은 중장기적으로 결국 추가 성장 동력

구글, 향후 음성 검색 시장 경쟁력 확보 예상

아마존 (AMZN US) 음성 쇼핑의 시대를 열다

음성 인식 AI의 확대는 아마존에게 기회

아마존, 음성 쇼핑을 통한 거래금액 확대 예상

Page 40: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

40 Mirae Asset Daewoo Research

음성 검색의 시대 개화

인터넷 검색의 입력 형태가 기존 텍스트 위주를 벗어나 자연어 음성, 오디오, 이미지 등으로

다변화되고 있다. 특히 음성 검색의 경우 음성 인터페이스의 간편함과 인공지능 엔진의 정교함이

결합되면서 이용자의 경험도 향상되고 있다. NAVER는 네이버 모바일 앱과 인공지능 모바일 앱

‘클로바’에 음성 인식 기능을 넣었다. 뿐만 아니라 하드웨어 기기들에도 음성 검색 기능을 넣고

있다. 스피커 ‘웨이브’, ‘프렌즈’, 자동차 인포테인먼트 ‘어웨이(AWAY)’ 등이다.

커머스 부문, 유통 밸류 체인의 완성

음성 인터페이스 시대에는 커머스 기능이 가장 중요하게 부각될 전망이다. 음성 명령을 통한 결제

는 기존 모바일 간편결제보다 더 직관적으로 재빠르게 실행될 수 있다. 인터넷 플랫폼의 작동

엔진도 검색 및 노출 메커니즘에서 추천 및 큐레이션 메커니즘으로 점차 전환되고 있다. 이러

한 상황에서는 ‘과정’에서 등장하는 검색광고보다 ‘최종 액션’에 해당하는 구매와 결제 등 커머

스 기능이 더욱 중요해질 수 있다.

NAVER는 현재 검색광고의 강자이지만, 음성 인터페이스와 인공지능 추천 엔진 시대에 대해

서도 대비하고 있다고 판단된다. 유통 밸류체인을 지속적으로 강화하고 있기 때문이다. 검색은

소비자와의 대표 접점으로 살려두고, 커머스 서비스를 네이버 쇼핑, 윈도, 스토어팜, 예약, 쇼

핑렌즈 등으로 다양화하고 있다. 결제는 국내 네이버페이, 해외 라인페이가 부각된다. 물류 제

휴, 마케팅 및 데이터 관리, 클라우드 컴퓨팅 등 관련 인프라에 대한 투자도 진행하고 있다.

인공지능 적용으로 플랫폼 확대, 클라우드 매출로도 연결

인공지능 적용으로 인터넷 플랫폼의 지배력이 확대되는 것에도 주목된다. 오프라인 침투를 통해

신규 매출 기회를 발굴하고 있다. 실내 소형 및 대형 공간, 야외 공간, 산업 시설, 도로 위 주

행 중인 자동차 등에 대해 로보틱스, 자율주행차 연구 등을 통해 접근하고 있다. 인공지능 사

업은 클라우드 플랫폼 사업과 연계되면서 IT플랫폼 매출에 긍정적인 영향을 줄 전망이다.

투자의견 '매수', 12개월 목표주가 120만원 제시

NAVER에 대한 ‘매수’ 투자의견과 120만원의 목표주가를 유지한다. 음성 인터페이스 시대에 검

색, 커머스, 인공지능 부문에 대한 투자, 기능 강화, 저변 확대를 통해 준비하고 있는 점이 긍

정적이다. 내년에는 올해 투자한 분야에 대한 매출 발생이 좀 더 본격화될 것으로 예상된다.

NAVER (035420)

검색, 커머스, 인공지능 – 삼각 편대로 공략

인터넷

투자의견(유지) 매수

목표주가(12M,유지) 1,200,000원

현재주가(17/11/09) 825,000원

상승여력 45%

영업이익(17F,십억원) 1,253

Consensus 영업이익(17F,십억원) 1,215

EPS 성장률(17F,%) 12.2

MKT EPS 성장률(17F,%) 46.9

P/E(17F,x) 32.3

MKT P/E(17F,x) 10.4

KOSPI 2,550.57

시가총액(십억원) 27,194

발행주식수(백만주) 33

유동주식비율(%) 78.7

외국인 보유비중(%) 59.6

베타(12M) 일간수익률 1.00

52주 최저가(원) 720,000

52주 최고가(원) 960,000

주가상승률(%) 1개월 6개월 12개월

절대주가 10.7 -2.4 2.5

상대주가 4.0 -12.2 -21.3

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억원) 2,758 3,254 4,023 4,712 5,486 6,266

영업이익 (십억원) 758 830 1,102 1,253 1,585 1,852

영업이익률 (%) 27.5 25.5 27.4 26.6 28.9 29.6

순이익 (십억원) 454 519 749 841 1,115 1,297

EPS (원) 13,787 15,737 22,732 25,515 33,838 39,348

ROE (%) 27.8 26.5 26.2 19.9 20.7 19.8

P/E (배) 51.6 41.8 34.1 32.3 24.4 21.0

P/B (배) 8.7 6.8 5.2 4.5 3.8 3.3

배당수익률 (%) 0.1 0.2 0.1 0.1 0.2 0.2

주: K-IFRS 연결 기준, 순이익은 지배주주 귀속 순이익

자료: NAVER, 미래에셋대우 리서치센터

[인터넷/게임/광고]

문지현

02-3774-1640

[email protected]

70

90

110

130

150

16.11 17.3 17.7 17.11

NAVER KOSPI

Page 41: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 41

그림 68. 음성 검색: 직관적인 인터페이스 특징, 인공지능 기술의 발전으로 사용량 증가세

자료: 나스미디어, 미래에셋대우 리서치센터

그림 69. 음성 커머스: 유통 밸류 체인 완성을 통해 대비 중

자료: 미래에셋대우 리서치센터

그림 70. 인공지능: 음성인식 기기, 로보틱스 개발, 자율주행 연구를 통해 플랫폼 지배력 확대

자료: NAVER, NAVER Labs, 미래에셋대우 리서치센터

Page 42: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

42 Mirae Asset Daewoo Research

표 7. NAVER 연간 실적 추이와 전망 (십억원, %)

2014 2015 2016 2017F 2018F

매출액 2,758 3,254 4,023 4,712 5,486

광고 400 471 542

비즈니스플랫폼 1,866 2,145 2,446

IT플랫폼 121 229 366

콘텐츠서비스 103 102 112

LINE 및 기타플랫폼 1,534 1,764 2,020

영업이익 758 830 1,102 1,253 1,585

영업이익률 27.5 25.5 27.4 26.6 28.9

순이익 452 517 759 848 1,122

순이익률 16.4 15.9 18.9 18.0 20.5

YoY 성장률

매출액 18.0 23.6 17.1 16.4

광고 18.0 15.0

비즈니스플랫폼 15.0 14.0

IT플랫폼 90.0 60.0

콘텐츠서비스 -1.0 10.0

LINE 및 기타플랫폼 15.0 14.5

영업이익 9.5 32.7 13.7 26.5

순이익 14.4 46.8 11.8 32.3

주: K-IFRS 연결 기준, 2013년 한게임과 분리되어 NAVER 설립,

2017년 매출 구분을 기존 광고/콘텐츠/기타에서 광고/비즈니스플랫폼/IT플랫폼/콘텐츠서비스/LINE 및 기타플랫폼으로 변경,

새로운 매출 구분은 2016년부터만 제공. 광고 부문은 일반 및 쇼핑 디스플레이 광고와 동영상 광고 포함,

비즈니스플랫폼 부문은 일반 및 쇼핑 검색광고 포함, IT플랫폼 부문은 페이, IT서비스, 클라우드 등 포함, 콘텐츠서비스는 뮤직, 웹툰, V LIVE 등,

LINE 및 기타플랫폼은 LINE과 캠프모바일, 스노우 포함, 순이익은 지배/비지배주주 합산 기준

자료: NAVER, 미래에셋대우 리서치센터

그림 71. NAVER 12개월 Forward PER 밴드와 주가 추이

자료: 미래에셋대우 리서치센터

57.9x

36.0x

29.5x

24.0x

5.0x

0

500,000

1,000,000

1,500,000

2,000,000

12 13 14 15 16 17 18

(원)

Page 43: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 43

NAVER (035420)

예상 포괄손익계산서 (요약) 예상 재무상태표 (요약)

(십억원) 12/16 12/17F 12/18F 12/19F (십억원) 12/16 12/17F 12/18F 12/19F

매출액 4,023 4,712 5,486 6,266 유동자산 4,200 5,628 7,077 8,685

매출원가 0 0 0 0 현금 및 현금성자산 1,726 2,667 3,654 4,776

매출총이익 4,023 4,712 5,486 6,266 매출채권 및 기타채권 694 831 942 1,076

판매비와관리비 2,921 3,459 3,901 4,415 재고자산 10 12 14 16

조정영업이익 1,102 1,253 1,585 1,852 기타유동자산 1,770 2,118 2,467 2,817

영업이익 1,102 1,253 1,585 1,852 비유동자산 2,171 2,338 2,342 2,370

비영업손익 30 52 53 53 관계기업투자등 182 218 254 290

금융손익 30 35 47 59 유형자산 863 901 763 647

관계기업등 투자손익 -9 -2 0 0 무형자산 112 139 124 111

세전계속사업손익 1,132 1,305 1,638 1,905 자산총계 6,371 7,967 9,420 11,056

계속사업법인세비용 361 455 516 600 유동부채 1,804 2,091 2,401 2,713

계속사업이익 771 851 1,122 1,305 매입채무 및 기타채무 425 509 592 676

중단사업이익 -12 -3 0 0 단기금융부채 227 203 203 203

당기순이익 759 848 1,122 1,305 기타유동부채 1,152 1,379 1,606 1,834

지배주주 749 841 1,115 1,297 비유동부채 437 494 550 607

비지배주주 10 7 7 8 장기금융부채 150 150 150 150

총포괄이익 724 864 1,122 1,305 기타비유동부채 287 344 400 457

지배주주 733 842 1,094 1,273 부채총계 2,241 2,585 2,951 3,320

비지배주주 -9 21 28 32 지배주주지분 3,595 4,845 5,925 7,183

EBITDA 1,265 1,432 1,737 1,981 자본금 16 16 16 16

FCF 1,010 1,051 1,508 1,648 자본잉여금 1,217 1,448 1,448 1,448

EBITDA 마진율 (%) 31.4 30.4 31.7 31.6 이익잉여금 3,810 4,587 5,667 6,925

영업이익률 (%) 27.4 26.6 28.9 29.6 비지배주주지분 535 537 544 552

지배주주귀속 순이익률 (%) 18.6 17.8 20.3 20.7 자본총계 4,130 5,382 6,469 7,735

예상 현금흐름표 (요약) 예상 주당가치 및 valuation (요약)

(십억원) 12/16 12/17F 12/18F 12/19F 12/16 12/17F 12/18F 12/19F

영업활동으로 인한 현금흐름 1,164 1,237 1,508 1,648 P/E (x) 34.1 32.3 24.4 21.0

당기순이익 759 848 1,122 1,305 P/CF (x) 18.5 18.7 15.6 13.8

비현금수익비용가감 624 607 617 666 P/B (x) 5.2 4.5 3.8 3.3

유형자산감가상각비 146 162 138 117 EV/EBITDA (x) 18.2 16.4 12.7 10.4

무형자산상각비 17 17 15 13 EPS (원) 22,732 25,515 33,838 39,348

기타 461 428 464 536 CFPS (원) 41,966 44,151 52,764 59,800

영업활동으로인한자산및부채의변동 88 208 233 213 BPS (원) 150,192 182,529 215,297 253,487

매출채권 및 기타채권의 감소(증가) -56 -633 -94 -94 DPS (원) 1,131 1,200 1,300 1,400

재고자산 감소(증가) 0 15 -2 -2 배당성향 (%) 4.3 4.2 3.4 3.2

매입채무 및 기타채무의 증가(감소) 11 9 0 0 배당수익률 (%) 0.1 0.1 0.2 0.2

법인세납부 -339 -467 -516 -600 매출액증가율 (%) 23.6 17.1 16.4 14.2

투자활동으로 인한 현금흐름 -942 -733 -449 -452 EBITDA증가율 (%) 28.3 13.2 21.3 14.0

유형자산처분(취득) -97 -185 0 0 조정영업이익증가율 (%) 32.8 13.7 26.5 16.8

무형자산감소(증가) -21 -4 0 0 EPS증가율 (%) 44.4 12.2 32.6 16.3

장단기금융자산의 감소(증가) -662 -450 -449 -452 매출채권 회전율 (회) 9.1 9.0 8.9 8.8

기타투자활동 -162 -94 0 0 재고자산 회전율 (회) 311.2 414.5 409.3 405.6

재무활동으로 인한 현금흐름 698 422 -35 -38 매입채무 회전율 (회) 0.0 0.0 0.0 0.0

장단기금융부채의 증가(감소) -290 -24 0 0 ROA (%) 14.1 11.8 12.9 12.7

자본의 증가(감소) 1,084 231 0 0 ROE (%) 26.2 19.9 20.7 19.8

배당금의 지급 -32 -65 -35 -38 ROIC (%) 169.2 251.1 857.8 -741.7

기타재무활동 -64 280 0 0 부채비율 (%) 54.3 48.0 45.6 42.9

현금의 증가 913 941 988 1,121 유동비율 (%) 232.8 269.2 294.8 320.1

기초현금 813 1,726 2,667 3,654 순차입금/자기자본 (%) -73.1 -80.1 -87.0 -91.5

기말현금 1,726 2,667 3,654 4,776 조정영업이익/금융비용 (x) 181.5 2,823.0 3,694.6 4,317.1

자료: NAVER, 미래에셋대우 리서치센터

Page 44: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

44 Mirae Asset Daewoo Research

국내 최초 음성 인식 스피커 NUGU를 통한 성장 동력 확보

SK텔레콤은 음성 인터페이스 기반의 성장 가시성을 높여갈 수 있을 것으로 기대한다. 2016년

국내 최초로 음성 인식 스피커 ‘NUGU’를 출시했고, 지난 8월에는 보급형 모델인 ‘NUGU

mini’ 선보이며 라인업을 확대했다. 최근에는 ‘T맵XNUGU’(내비게이션) 및 ‘JooN’(키즈폰)으

로 서비스를 확장하면서 사용자 경험을 확보하고 있다. 특히 내비게이션과 키즈폰의 경우 음성

인터페이스에 대한 수요가 높아 사용자 침투의 빠른 증가를 예상한다. 사용자로 하여금 NUGU

플랫폼에 대한 경험을 쌓게 만들고, 이를 NUGU 단말로 이끌어 올 수 있다는 측면에서 상당히 강

력하다고 판단한다.

콘텐츠 및 커머스 영역으로의 서비스 확장 용이

SK텔레콤은 이미 사용자 편의성을 높여줄 수 있는 서비스를 모두 갖추고 있어 음성 인터페이스 플

랫폼에서 지배적인 사업자가 될 수 있는 가능성이 높다고 판단한다. 1) 핵심 콘텐츠 플랫폼인 멜론

(음악 스트리밍)과 B tv(유료방송: IPTV)와의 시너지도 기대할 수 있다. 멜론과 B tv는 각각

400만 이상의 가입자를 보유하고 있다. 기존 가입자 저변을 통해 NUGU의 효용성을 높이면서

초기 지배력 확보에 기여할 것으로 판단한다. T맵XNUGU에서 멜론 서비스를 이용한 사용자가

편리함을 느껴 NUGU 스피커를 구매하고, 이를 B tv에 연동해 사용하게 하는 선순환을 만들

어 갈 수 있을 것으로 기대한다.

2) 자회사 11번가를 활용한 전자상거래 서비스 제공도 기대할 수 있다. 초기 사용자 만족도 제

고를 위해 자주 구매하는 생활필수품 등을 간단한 음성 조작으로 편리하고 저렴하게 구매할 수

있는 서비스 제공이 가능하다. 음성 인식 스피커의 초기 만족도를 높이고 시장 지배력을 확대

하는 것에 기여할 수 있을 것이다.

기존 사업의 안정적인 수익성과 배당 매력 기반의 성장 가시성 부각

SK텔레콤에 대한 투자의견 ‘매수’ 및 목표주가 33만원을 유지한다. 기존 통신서비스 사업의 정책

적인 위험 요인은 상존하지만 단통법 하에서 시장이 과열되지 않고 있다. 1) 데이터 사용량 증

가를 기반으로 한 요금제 상향, 2) VoD 기반의 IPTV 매출 성장 및 3) 기가 인터넷 확대를 통

한 초고속인터넷 매출 증가 등을 기반으로 분기 영업이익 4천억원 수준의 안정적인 수익을 지

속 시현하고 있다. 안정적인 수익성을 기반으로 배당수익률이 4%에 육박하고 있어 성장에 대

한 기대를 감안할 때 충분히 매력적이라고 판단한다.

SK텔레콤 (017670)

핵심 애플리케이션 다 갖췄다

유무선통신

투자의견(유지) 매수

목표주가(12M,유지) 330,000원

현재주가(17/11/09) 253,500원

상승여력 30%

영업이익(17F,십억원) 1,629

Consensus 영업이익(17F,십억원) 1,612

EPS 성장률(17F,%) 65.0

MKT EPS 성장률(17F,%) 46.1

P/E(17F,x) 7.4

MKT P/E(17F,x) 10.5

KOSPI 2,550.57

시가총액(십억원) 20,469

발행주식수(백만주) 81

유동주식비율(%) 62.2

외국인 보유비중(%) 41.9

베타(12M) 일간수익률 0.90

52주 최저가(원) 217,000

52주 최고가(원) 283,500

주가상승률(%) 1개월 6개월 12개월

절대주가 -0.6 7.4 16.0

상대주가 -6.7 -3.4 -10.9

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억원) 17,164 17,137 17,092 17,515 17,647 17,750

영업이익 (십억원) 1,825 1,708 1,536 1,629 1,709 1,812

영업이익률 (%) 10.6 10.0 9.0 9.3 9.7 10.2

순이익 (십억원) 1,801 1,519 1,676 2,766 2,999 2,838

EPS (원) 22,307 18,807 20,756 34,251 37,143 35,147

ROE (%) 12.9 10.2 10.7 16.5 16.1 13.6

P/E (배) 12.0 11.5 10.8 7.4 6.8 7.2

P/B (배) 1.3 1.0 1.0 1.0 0.9 0.8

배당수익률 (%) 3.5 4.6 4.5 3.9 3.9 3.9

주: K-IFRS 연결 기준, 순이익은 지배주주 귀속 순이익

자료: SK텔레콤, 미래에셋대우 리서치센터

[통신서비스/IoT]

이학무

02-3774-1785

[email protected]

하누리

02-3774-1653

[email protected]

80

90

100

110

120

130

140

16.11 17.3 17.7 17.11

SK텔레콤 KOSPI

Page 45: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 45

핵심 애플리케이션을 통한 기술적인 한계 보완 및 확장성 확보

음성 인터페이스가 시장에 정착하기 위해서는 1) 사용자가 충분히 만족할만한 기술적인 완성도가

필요하고, 2) 새로운 인터페이스의 사용에 매력을 느낄 수 있는 핵심 애플리케이션이 있어야 하며,

3) 활용 영역 확대를 위한 서비스 확장성을 확보해야 한다.

음성 인식 스피커가 개인 비서 역할을 완벽하게 수행하기에는 아직 기술적인 한계가 있다. 그러나

사용자 기대를 특정 수준으로 제한할 경우에는 사용자 니즈에 부합할만한 기술 수준에 상당히 근

접한 것으로 판단한다. 예를 들어 가정 내 사물인터넷 기기 조작, IPTV 제어, 음악 감상 등의 정도

로 그 사용을 제한한다면 이미 사용자가 만족할만한 수준까지 기술의 완성도는 높아져 있다.

기술적 한계를 보완하기 위한 보조적인 기능의 개발도 중요하다. 음악 재생에 있어서는 기존의 음

악 스트리밍 서비스 내에 이미 구성해 놓은 재생 목록을 재생하도록 하는 것이 하나이다. 음성 인

터페이스로 원하는 음악을 찾아 특정한 재생 목록을 구성하기에는 불편하고 어려운 점이 많을 뿐

아니라 정확하게 인식하기에는 아직 기술적으로 부족한 점이 있다. 그러나 “내 재생 목록 1번 틀

어줘” 등 간단한 명령으로도 실행 가능한 보조 기능을 탑재한다면 현재 기술 수준에서도 충분히

편리성과 만족도를 높일 수 있을 것이다.

시장이 형성되고 있는 초기 단계에서는 핵심 애플리케이션을 보유하고 있거나 관련 업체와의 협력

이 중요하다. SK텔레콤은 내비게이션의 강자인 T맵을 보유하고 있다. 최근에는 NUGU를 결합하여

음성 인식이 가능한 서비스를 출시했다. 또한 음성 인식 스피커의 주요 서비스 중 하나인 음악 스

트리밍과 관련하여 국내 음원 시장 지배적 사업자인 로엔과 긴밀한 관계가 있다. SK텔레콤의 음성

인식 스피커 NUGU에도 로엔의 음악 스트리밍 서비스인 멜론이 탑재되어 있다. 자회사 SK브로드

밴드를 통해 진행하고 있는 IPTV 사업은 유료방송 시장 내 지배력을 지속 강화시키면서 순항하고

있다. SK플래닛을 통해 11번가라는 국내 최대 전자상거래 업체를 자회사로 두고 있기도 하다.

SK텔레콤이 확보하고 있는 다양한 애플리케이션은 음성 인터페이스의 기술적 한계를 보완하면서 사용

자 만족도를 높이는 데에 주요한 역할을 할 것이다. 나아가 커머스, 콘텐츠 등으로의 서비스 확장에 있

어서도 유효하게 작용하면서 초기 시장 경쟁에서 유리한 위치를 선점할 것으로 전망한다.

그림 72. SK텔레콤의 핵심 애플리케이션

자료: 미래에셋대우 리서치센터

Page 46: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

46 Mirae Asset Daewoo Research

NUGU에 날개를 달아준 T맵XNUGU

애플은 이미 수년 전부터 자사 디바이스에 음성 비서 서비스인 시리를 탑재해왔다. 그러나 실질적

인 사용률은 높지 않은 것으로 파악되고 있다. 스마트폰과 테블릿PC에서는 음성 인터페이스보다

터치 인터페이스가 훨씬 편리하기 때문이다. 음성 인터페이스를 사용할 때도 있지만 터치로 직접

입력하는 것보다 정확도가 낮다. 이로 인해 사용자 만족도가 떨어지면서 사용률이 더욱 낮아지는

악순환을 보이는 것으로 판단한다. 따라서 음성 인터페이스는 그의 활용에 더욱 적합한 환경과 필요

성이 높은 상황을 제공하는 기기에 적용되어야 한다.

음성 인터페이스 활용에 적합한 공간으로서 차량을 들 수 있다. 주행으로 눈과 손이 자유롭지 못한

운전자는 내비게이션 사용을 위해 주/정차를 하거나 위험하게 해당 기기를 조작할 수 밖에 없다.

그러나 음성 인터페이스로 이를 지원한다면 교통 안전성과 함께 사용자의 편의성을 한층 향상시킬

수 있을 것이다. 또한 미디어 콘텐츠 서비스 제공을 통해 차량 내 인포테인먼트 시장으로 그 지배

력을 확장해 나갈 수 있는 가능성에 주목한다.

이러한 측면에서 SK텔레콤의 차세대 내비게이션 서비스 ‘T맵XNUGU’는 중요한 의미를 가진다.

기존 T맵에 NUGU를 접목시켜 내비게이션과 NUGU가 지원하는 기능을 음성을 통해 이용할 수

있는 서비스이다. 2002년 출시된 T맵은 국내에서 사용도가 가장 높은 내비게이션으로 1,000만명

이상의 월간 사용자를 보유하고 있는데 출시 2개월도 되지 않은 T맵XNUGU의 다운로드가 700만에

이르는 점은 고무적이다. 또한 기존 NUGU 대비 10배에 가까운 발화량 증가를 이끌어내며 T맵

XNUGU의 파급력을 여실히 증명했다. 현재는 목적지 설정 및 변경 등의 내비게이션 이용, 멜론에

연동한 음악 재생, 날씨 조회 등이 가능하다. 아직 제공되는 서비스가 제한적이나 추가 업데이트를

통해 연내로 전화 수신, 도착 예정 시간 문자 송부 등의 신규 기능을 더할 계획이다.

표 8. 플랫폼별 음성 인식 서비스 사용: 스마트폰 사용율 감소 vs. 음성 인식 스피커 사용율 증가 (백만명, %)

사업자 음성 인식 플랫폼 단말 월간 순사용자

변화율 2016년 5월 2017년 5월

애플 시리 스마트폰 48.7 41.4 -15.0

삼성 S Voice 스마트폰 24.8 23.2 -6.5

구글 구글 홈 음성 인식 스피커 4.5 4.7 4.4

아마존 알렉사 음성 인식 스피커 0.8 2.6 225.0

마이크로소프트 코타나 음성 인식 스피커 0.2 0.7 250.0

자료: Verto Analytics, 미래에셋대우 리서치센터

그림 73. T맵XNUGU의 기능 그림 74. T맵XNUGU 출시로 NUGU 발화량 급증

자료: SK텔레콤, 미래에셋대우 리서치센터 주: 일간 발화량 기준

자료: SK텔레콤, 미래에셋대우 리서치센터

Page 47: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 47

음성 인터페이스 생태계 구축에도 유리

사용자의 실수요를 높이고 시장 지배력을 확보하기 위해서는 음성 인터페이스에 대한 경험을 제공

하는 것을 넘어 활용 영역의 확대가 중요하다. 이에 1) 핵심 단말이 될 것으로 예상되는 음성 인식 스

피커의 출시 및 보급과, 2) IPTV를 포함한 가정 내 사물인터넷 연동, 그리고 3) 커머스를 포함한 O2O

서비스의 제공이 필요하다.

SK텔레콤은 자체 기술력으로 2016년 9월 국내 최초 음성 인식 스피커 NUGU를 출시했다. 지난

8월에는 후속 제품으로 가격은 낮추고 활용성은 높인 NUGU mini를 출시했다. 자사 IPTV인 B tv

와 연동되어 있어 음성 명령으로 셋탑박스의 전원을 작동하고 채널을 바꾸는 것이 가능하다. 또한

음성만으로 콘텐츠 검색과 선택이 가능하기 때문에 편의성을 높여 콘텐츠 소비를 늘리는 것에 기

여하고 있는 것으로 파악된다. 물론 시청자가 원하는 콘텐츠를 더욱 정확하게 찾아주기 위한 알로

리즘과 데이터 베이스 구축은 지속적으로 개선되어야 할 것이다.

그림 75. SK텔레콤의 음성 인식 스피커 NUGU와 NUGU mini 스펙 비교

자료: SK Insight, 미래에셋대우 리서치센터

그림 76. NUGU 누적 판매 실적

자료: SK텔레콤, 미래에셋대우 리서치센터

38 54

66 80

98 116

131

169

0

40

80

120

160

200

17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8

(천대)

NUGU 판매량

1월

하이마트

직매장 판매

3월

이마트

MOU 체결

4월

지상파

광고

5월

누구 지원

셋톱 확대

6월

패스티벌

개최

8월

NUGU mini

출시

Page 48: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

48 Mirae Asset Daewoo Research

그림 77. NUGU 일간 발화량 변화 추이

자료: SK텔레콤, 미래에셋대우 리서치센터

사물인터넷 연동은 필수적

가정용 사물인터넷 사업인 스마트홈 서비스 또한 음성 인터페이스의 주요한 활용 영역의 될 것이다. 간

단한 음성 명령으로 사물인터넷 기기를 컨트롤 할 수 있게 되면 편의성이 크게 증가하면서 소비자

만족도가 향상될 것이다. 스마트홈 사업을 시작한 2015년 이후 2년이라는 시간이 지났음에도 상

용화가 더딘 이유는 터치 인터페이스 기반으로 서비스를 제공하기 때문이다. 터치 기반에서는 기기

의 제어를 위해 먼저 스마트폰을 찾아서 앱을 켜고 해당 기기를 선택해 필요한 컨트롤을 해야 하

는 과정을 거쳐야 한다. 해당 기기를 직접 컨트롤 하는 것이 더 간단한 셈이다.

음성 인터페이스 기반의 사물인터넷은 소비자의 수요를 이끌어내는 데에 충분한 부가가치를 창출할 것

으로 기대한다. 이에 스마트홈 서비스를 제공하는 통신서비스 업체가 경쟁력이 있다고 판단한다.

SK텔레콤은 국내 최초로 2016년 4월 IoT 전용망 LoRa의 전국망 구축을 완료하며 사물인터넷 사

업의 본격화를 위한 준비를 마쳤다. 또한 음성 인식 내비게이션인 T맵XNUGU를 통해 차량 내에

서도 음성으로 스마트홈 기기들을 컨트롤할 수 있어 음성 인터페이스 시장 경쟁에서 우위를 보일

수 있을 것으로 전망한다.

그림 78. NUGU를 통해 제어 가능한 스마트홈 기기

자료: SK텔레콤, 미래에셋대우 리서치센터

194

264

327 351

302 332 350

393

542

0

100

200

300

400

500

600

16.12 17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8

(천회)

NUGU 일간 발화량

12월

서비스 확대

(B tv, 교통정보 등)

3월

서비스 확대

(프로야구, 11번가 등)

4월

지상파 광고

6월

발화 인식률

개선

8월

서비스 확대

(감성대화, 영화)

Page 49: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 49

커머스 및 O2O 영역에서도 시너지 기대

음성 인터페이스의 주요한 서비스인 커머스(11번가) 및 O2O(T맵) 연동이 상대적으로 용이한 것도 SK

텔레콤이 시장에서 우위를 보일 수 있는 요인이 될 것이다. 해당 서비스들은 도입 초기에 수익 기

여를 기대하기는 어렵지만, NUGU 단말기가 하나의 플랫폼으로서 시장 지배력을 강화하는 데에는

충분히 기여할 수 있다고 판단한다.

커머스 영역에서의 음성 인터페이스 활용은 소비자를 유인하는 데에 유효하게 작용할 것으로 예상한

다. 특히 반복적으로 구매하는 생활용품의 경우에는 기존 구매 이력을 기반으로 음성 인터페이스를

통해 구매하는 것이 더욱 용이할 수 있다. 소비자의 구매 패턴을 분석하여 맞춤형 상품을 추천한다

면 쇼핑 자체의 번거로움을 제거해 주면서 만족도를 향상시키는 데에 크게 기여할 것이다.

SK텔레콤이 보유한 11번가는 서비스 다변화 및 인공 지능 기술 접목 등을 통해 차세대 커머스 업체로

의 진화를 위한 노력을 지속하고 있어 NUGU와의 강한 시너지 창출이 기대된다. 2016년 4월 이천에

물류센터를 설립하고 상품 직매입 제도를 도입했다. 일반 온라인 쇼핑몰과 같이 판매와 유통 그리

고 마케팅까지 직접 참여하는 방식을 통해 거래에 있어 영향력을 높이고 있다. 온라인으로 식품을

구매하는 1인 가구가 늘어나면서 온라인 농식품 거래량이 증가하는 추세를 반영한 신선 식품 직배

송 서비스 ‘NOW프레시’의 시범 운영을 시작하기도 했다. 지난 3월에는 인공지능 기술인 챗봇을

도입한 대화형 상품 추천 서비스 ‘바로’를 출시했다. 추천의 정확도를 향상시킬 수 있도록 관련 기

술 개발을 지속 추진하면서 유통 혁신을 이루겠다는 목표를 다지고 있다.

T맵 택시 등의 O2O 서비스를 보유한 점도 음성 인터페이스의 확장 측면에서 상당히 유리하다고 판단

한다. NUGU에 연동될 시 출근 준비 중에 간단한 음성 명령으로 택시를 호출하는 등의 서비스가

가능해진다. 카카오 택시에 비해 시장 지배력이 낮은 점은 해결해야 할 문제이다. NUGU 단말기에

VoIP 서비스를 적용하여 배달 음식 업체에 전화를 연결하는 등의 서비스를 제공할 수도 있을 것이

다. 이미 NUGU는 피자(도미노피자)와 치킨(BBQ치킨)을 주문할 수 있는 기능이 탑재되어 있지만

사전에 배달지 주소를 입력해야 하는 절차가 있고 제휴된 업체 서비스만 제공할 수 있다는 단점이

있다. VoIP 서비스를 제공하면 원하는 업체의 전화 번호를 찾는 단계를 생략할 수 있고 NUGU 단

말과의 친숙도를 높이는 역할도 수행할 수 있을 것으로 기대한다.

그림 79. NUGU의 쇼핑 및 배달음식 주문 기능

자료: SK텔레콤, 미래에셋대우 리서치센터

Page 50: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

50 Mirae Asset Daewoo Research

SK텔레콤 (017670)

예상 포괄손익계산서 (요약) 예상 재무상태표 (요약)

(십억원) 12/16 12/17F 12/18F 12/19F (십억원) 12/16 12/17F 12/18F 12/19F

매출액 17,092 17,515 17,647 17,750 유동자산 5,997 6,184 6,495 7,348

매출원가 0 0 0 0 현금 및 현금성자산 1,505 1,622 1,761 2,349

매출총이익 17,092 17,515 17,647 17,750 매출채권 및 기타채권 3,362 3,322 3,382 3,515

판매비와관리비 15,556 15,886 15,938 15,938 재고자산 260 268 269 272

조정영업이익 1,536 1,629 1,709 1,812 기타유동자산 870 972 1,083 1,212

영업이익 1,536 1,629 1,709 1,812 비유동자산 25,301 26,305 28,064 29,202

비영업손익 560 1,806 2,159 1,848 관계기업투자등 7,404 8,885 10,929 12,022

금융손익 -236 -235 -235 -230 유형자산 10,374 9,962 9,673 9,705

관계기업등 투자손익 545 878 0 0 무형자산 5,709 5,683 5,683 5,683

세전계속사업손익 2,096 3,435 3,868 3,660 자산총계 31,298 32,489 34,560 36,550

계속사업법인세비용 436 691 890 842 유동부채 6,444 6,693 6,482 6,333

계속사업이익 1,660 2,745 2,978 2,818 매입채무 및 기타채무 2,170 1,918 1,694 1,508

중단사업이익 0 0 0 0 단기금융부채 1,280 1,684 1,685 1,686

당기순이익 1,660 2,745 2,978 2,818 기타유동부채 2,994 3,091 3,103 3,139

지배주주 1,676 2,766 2,999 2,838 비유동부채 8,737 8,216 8,225 8,253

비지배주주 -16 -21 -21 -20 장기금융부채 6,479 5,885 5,885 5,885

총포괄이익 1,413 2,785 2,978 2,818 기타비유동부채 2,258 2,331 2,340 2,368

지배주주 1,433 2,801 2,992 2,831 부채총계 15,181 14,909 14,707 14,585

비지배주주 -20 -17 -14 -13 지배주주지분 15,971 17,489 19,782 21,914

EBITDA 4,604 4,851 4,918 4,901 자본금 45 45 45 45

FCF 1,753 2,759 3,038 2,559 자본잉여금 2,916 2,916 2,916 2,916

EBITDA 마진율 (%) 26.9 27.7 27.9 27.6 이익잉여금 15,953 17,429 19,722 21,854

영업이익률 (%) 9.0 9.3 9.7 10.2 비지배주주지분 145 91 70 50

지배주주귀속 순이익률 (%) 9.8 15.8 17.0 16.0 자본총계 16,116 17,580 19,852 21,964

예상 현금흐름표 (요약) 예상 주당가치 및 valuation (요약)

(십억원) 12/16 12/17F 12/18F 12/19F 12/16 12/17F 12/18F 12/19F

영업활동으로 인한 현금흐름 4,243 5,875 5,958 5,679 P/E (x) 10.8 7.4 6.8 7.2

당기순이익 1,660 2,745 2,978 2,818 P/CF (x) 3.8 3.4 3.0 3.1

비현금수익비용가감 3,040 3,206 3,936 3,763 P/B (x) 1.0 1.0 0.9 0.8

유형자산감가상각비 3,069 3,223 3,209 3,089 EV/EBITDA (x) 5.2 5.3 5.2 5.1

무형자산상각비 0 0 0 0 EPS (원) 20,756 34,251 37,143 35,147

기타 -29 -17 727 674 CFPS (원) 58,203 73,699 85,624 81,502

영업활동으로인한자산및부채의변동 14 635 -264 -262 BPS (원) 225,796 244,597 272,995 299,397

매출채권 및 기타채권의 감소(증가) -505 80 -9 -27 DPS (원) 10,000 10,000 10,000 10,000

재고자산 감소(증가) 1 -8 -1 -3 배당성향 (%) 42.5 25.7 23.7 25.1

매입채무 및 기타채무의 증가(감소) 392 -348 2 5 배당수익률 (%) 4.5 3.9 3.9 3.9

법인세납부 -368 -819 -890 -842 매출액증가율 (%) -0.3 2.5 0.8 0.6

투자활동으로 인한 현금흐름 -2,462 -3,280 -3,034 -3,259 EBITDA증가율 (%) -2.1 5.4 1.4 -0.3

유형자산처분(취득) -2,468 -3,101 -2,920 -3,120 조정영업이익증가율 (%) -10.1 6.1 4.9 6.0

무형자산감소(증가) -619 -52 0 0 EPS증가율 (%) 10.4 65.0 8.4 -5.4

장단기금융자산의 감소(증가) 539 -131 -114 -139 매출채권 회전율 (회) 7.5 7.7 7.6 7.6

기타투자활동 86 4 0 0 재고자산 회전율 (회) 64.1 66.3 65.7 65.5

재무활동으로 인한 현금흐름 -1,045 -1,716 -740 -739 매입채무 회전율 (회) 0.0 0.0 0.0 0.0

장단기금융부채의 증가(감소) 25 -189 0 1 ROA (%) 5.5 8.6 8.9 7.9

자본의 증가(감소) 0 0 0 0 ROE (%) 10.7 16.5 16.1 13.6

배당금의 지급 -706 -1,271 -706 -706 ROIC (%) 8.1 8.5 8.7 9.2

기타재무활동 -364 -256 -34 -34 부채비율 (%) 94.2 84.8 74.1 66.4

현금의 증가 736 116 140 587 유동비율 (%) 93.1 92.4 100.2 116.0

기초현금 769 1,505 1,622 1,761 순차입금/자기자본 (%) 34.9 29.7 25.0 19.4

기말현금 1,505 1,622 1,761 2,349 조정영업이익/금융비용 (x) 5.3 5.5 5.8 6.2

자료: SK텔레콤, 미래에셋대우 리서치센터

Page 51: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 51

홈 IoT 및 콘텐츠 경쟁력을 통한 음성 인터페이스 시장 선점

LG유플러스는 이미 90만 가구 이상을 대상으로 홈 IoT 서비스를 제공하고 있어 음성 인터페이스

플랫폼 시장 선점이 기대된다. 한국어를 기준으로 현재 가장 많은 데이터를 보유하고 있는 네이

버의 음성 인식 엔진 ‘클로바’를 활용하여 음성 인식 스피커를 출시할 예정이다. 이에 음성 인

식률은 만족할만한 수준에 도달할 수 있을 것으로 예상되며 초기 시장 지배력 강화가 가능할

것으로 기대된다. 또한 LG유플러스가 보유한 콘텐츠 경쟁력과 풍부한 가입자 저변으로 축적해

온 데이터 베이스 역시 음성 인터페이스의 초기 시장을 선점하는 것에 중요한 역할을 담당할 것으

로 기대한다.

홈 IoT 부문에서 LG전자와의 시너지 창출 기대

계열사로 글로벌 가전 시장의 지배적인 사업자인 LG전자를 두고 있어 홈 IoT 시장의 초기 지배력

강화 가능성은 더 높다고 판단한다. LG유플러스는 이미 LG전자의 제품들을 홈 IoT로 공급하고

있다. LG유플러스의 음성 인식 스피커가 더 많은 LG전자의 가전 제품과 연동된다면 하나의

컨트롤 타워로서 통합 리모컨 역할을 수행하게 될 것이다. 이는 홈 IoT 시장의 지배적 사업자

가 되는 것에 중요한 교두보가 될 수 있다고 판단한다

WiFi가 아닌 IoT 전용망 ‘NB IoT’를 통해 사물인터넷 서비스를 제공할 수 있다는 장점도 있다.

NB IoT 기반으로 서비스를 할 경우 편리성과 안정성을 확보할 수 있어 초기 시장 지배력 확보

에 중요한 역할을 할 수 있다고 판단한다. 사용자에게 망 사용 요금을 추가로 내는 것에 대한

부담이 있을 수 있다. 가전 판매 업체가 제품 가격에 제품 수명까지 기간의 망 사용 요금을 포

함해서 받는 방식이 유효하다고 판단한다. 이와 같은 긴밀한 제휴는 계열사간에 더욱 원활하게

진행할 수 있다는 측면에서 LG유플러스가 유리해 보인다.

기존 통신 사업의 경쟁력 강화 역시 매력적

LG유플러스에 대해 투자의견 ‘매수’ 및 목표주가 19,000원을 유지한다. 음성 인터페이스 기반의

성장에 대한 기대가 유효한 상황에서 매 분기 10만명 이상의 MNO 순증 가입자를 꾸준히 보

여주고 있는 등 기존 통신 사업에서 경쟁 우위를 보이고 있다. 특히 지난 3분기의 경우 신규/

기변/번호이동 가입자가 140만을 상회했음에도 불구하고 마케팅비는 전분기 수준을 유지하는

등 성장과 비용 통제의 조화로운 균형을 확인시켜 주었다. 안정적인 수익성 증가를 기반으로

점진적인 배당수익률 증가를 기대할 수 있어 배당 매력 또한 높다고 판단한다.

LG유플러스 (032640)

홈 IoT 부문의 그룹 시너지 창출 기대

유무선통신

투자의견(유지) 매수

목표주가(12M,유지) 19,000원

현재주가(17/11/09) 12,400원

상승여력 53%

영업이익(17F,십억원) 821

Consensus 영업이익(17F,십억원) 822

EPS 성장률(17F,%) 8.0

MKT EPS 성장률(17F,%) 46.1

P/E(17F,x) 10.2

MKT P/E(17F,x) 10.5

KOSPI 2,550.57

시가총액(십억원) 5,414

발행주식수(백만주) 437

유동주식비율(%) 63.9

외국인 보유비중(%) 44.2

베타(12M) 일간수익률 0.83

52주 최저가(원) 11,200

52주 최고가(원) 17,000

주가상승률(%) 1개월 6개월 12개월

절대주가 -7.1 -11.1 6.0

상대주가 -12.8 -20.1 -18.6

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억원) 11,000 10,795 11,451 12,090 12,187 12,406

영업이익 (십억원) 576 632 746 821 901 912

영업이익률 (%) 5.2 5.9 6.5 6.8 7.4 7.4

순이익 (십억원) 228 351 493 532 607 610

EPS (원) 523 805 1,129 1,218 1,391 1,397

ROE (%) 5.6 8.1 10.6 10.7 11.4 10.6

P/E (배) 22.0 12.9 10.1 10.2 8.9 8.9

P/B (배) 1.2 1.0 1.0 1.1 1.0 0.9

배당수익률 (%) 1.3 2.4 3.1 3.6 4.4 5.2

주: K-IFRS 연결 기준, 순이익은 지배주주 귀속 순이익

자료: LG유플러스, 미래에셋대우 리서치센터

[통신서비스/IoT]

이학무

02-3774-1785

[email protected]

하누리

02-3774-1653

[email protected]

80

90

100

110

120

130

140

16.11 17.3 17.7 17.11

LG유플러스 KOSPI

Page 52: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

52 Mirae Asset Daewoo Research

네이버와의 제휴는 현명한 선택

음성 인터페이스는 플랫폼 사업의 특성상 초기 시장에서 가입자 저변을 확보하는 것이 매우 중요

하다. 가입자의 사용 및 소비 행태를 데이터로 축적하고 분석함을 통해 맞춤형 콘텐츠를 추천하고

확장된 서비스와 기능을 추가할 수 있기 때문이다. 조기 출시를 통해 초기 시장을 선점하면서 데이

터를 축적하거나 검색 엔진 업체와 같이 이미 대규모의 데이터를 가지고 있는 업체가 아니면 지배

적인 사업자가 되기 어렵다고 판단한다. 이러한 측면에서 후발 사업자인 LG유플러스가 네이버와의

제휴를 통해 네이버의 인공지능 플랫폼인 클로바를 탑재한 음성 인식 스피커를 출시하기로 결정한 것은

현명하고 적절한 선택으로 풀이된다.

홈 IoT의 강자, LG전자와의 시너지 기대

기존 가전 업체는 IoT를 프리미엄 급의 가전에나 탑재하는 옵션으로 분류해왔다. 이제는 리모컨처

럼 모든 가전에 제공되는 하나의 기능으로 관점을 바꿀 필요가 있다. 홈 IoT는 음성 인터페이스 도

입 효과가 가장 높을 영역으로 기대되기 때문이다. LG유플러스는 국내 홈 IoT 시장의 1위 사업자로

서 9월 기준 약 91만 가구 가입자를 보유하고 있는 것으로 파악된다. 또한 글로벌 가전기기 업체인

LG전자를 계열사로 두고 있어 사물인터넷 영역에서의 음성 인터페이스 활용이 더욱 기대된다. LG유플

러스의 음성 인식 스피커가 하나의 컨트롤 타워로서 LG전자 가전의 리모컨을 대신하게 된다는 것

은 홈 IoT 시장의 지배적 사업자가 되는 것에 중요한 교두보가 될 수 있다고 판단한다.

더욱 편리한 사용 환경을 위해 WiFi가 아닌 IoT 전용망 ‘NB IoT’를 통해 사물인터넷 서비스를 제공할

수 있다는 장점도 있다. WiFi를 통신 네트워크로 활용하는 경우에는 WiFi 공유기를 설치할 때 별도

로 설정이 필요하며 교체 시에는 또다시 새로운 설정을 해야 한다. 가정 내 WiFi 공유기의 위치

또한 고려해야 한다. WiFi 공유기가 없는 집은 이를 새로 구매해야 하며 공유기 자체의 고장 등으

로 인해 작동이 안 되는 경우가 있을 수도 있다. 설치는 번거롭고 사용은 불편한 것이다.

그러나 NB IoT 네트워크를 제공하면 평상시에 핸드폰을 사용하는 것처럼 쉽고 편리하게 사물인터

넷 서비스를 사용할 수 있다. 네트워크 사용 요금의 경우 소비자에게 월정액으로 부과하기 보다는

유통 시에 소비자 가격에 포함하여 판매한다면 구매 부담이 줄어들 것으로 판단한다. 이러한 전략

은 경쟁 업체도 가능하지만 그룹 차원에서 대응하는 것보다 빠른 대응이 어렵다는 측면에서 LG유

플러스가 유리하다고 판단한다.

그림 80. LG유플러스와 LG전자가 합작한 홈 IoT 기기

자료: LG유플러스, 미래에셋대우 리서치센터

Page 53: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 53

콘텐츠 경쟁력을 통한 시장 지배력 확보

유료방송 시장에서 통신서비스 업체들의 지배력 강화가 지속되고 있다. IPTV 서비스가 도입되기 시작

한 2007년 이후 10년이 흐른 지금, IPTV의 유료방송 시장 점유율은 이미 케이블TV를 넘어 지배

적 위치에 오른 것으로 파악된다. IPTV는 양방향성 서비스를 통해 VoD 등의 온디맨드(On-

Demand) 콘텐츠 수요를 이끈 장본인이다. 이로써 부가수익이 증가했을 뿐만 아니라 소비자의 미

디어 콘텐츠 구매 이력, 가입 패턴 등의 데이터를 확보할 수 있게 되었다.

2010년 들어 케이블TV 사업자들도 양방향 서비스가 가능한 신규 상품을 내놓기 시작했다. 모든

사업자가 디지털 방송 송출을 통해 양방향 서비스를 제공하게 되면서 기술적 방식에 기반한 서비

스 차별화가 어려워졌다. 또한 각종 규제 및 이해 관계자간의 충돌 등으로 가격 경쟁을 촉발하거나

결합 할인을 확대시키기도 쉽지 않다. 과거와 다른 시장 구조가 형성되고 있기 때문이다. 이제 유

료방송 사업자의 역량은 1) 콘텐츠 경쟁력과 2) 콘텐츠 추천의 정확도에 달려있다.

LG유플러스가 보유한 콘텐츠 경쟁력과 풍부한 가입자 저변으로 축적해 온 데이터 베이스는 음성

인터페이스 시장에서 경쟁력을 갖추는데 기여할 것으로 판단한다. 유료방송 시장의 진짜 경쟁은 단

통법이 도입된 2014년 10월 이후 시작되었다. 고가 요금제를 사용하는 무선 가입자에게 IPTV를

무료로 제공하는 것이 불가능해졌기 때문이다. 2014년 10월 이후 월간 IPTV 가입자 수를 살펴보면

LG유플러스의 성장이 가장 두드러진다. 콘텐츠 경쟁력이 특유의 영업력과 더해져 가입자를 유인하는 데

에 유효하게 작용한 것으로 파악된다.

또한 LG유플러스의 IPTV는 아이들을 타킷으로 한 콘텐츠 서비스 ‘아이들나라’를 제공하고 있다.

동화 구연가가 책을 읽어주는 TV, 영어/중국어 등 언어 교육 프로그램으로 구성된 유투브 키즈 등

을 포함하고 있다. 시력 보호 모드 기능과 함께 교육적인 콘텐츠를 풍부하게 제공하고 있어 부모의

거부감이 없는 특징이 있다. 무엇보다도 주 시청층인 영유아의 경우 기기 작동이나 문자 입력이 어

렵기 때문에 음성 인터페이스를 활성화하게 하는 유인이라고 판단한다.

LG유플러스는 이미 IPTV 서비스를 통해 음성 검색 기능을 제공하고 있다. 음성으로 리모컨을 찾

을 수도 있고, 채널 전환 및 영상 선택 등의 기능 또한 가능하다. 해당 기능을 통해 축적한 소비자

데이터는 조만간 출시될 자사의 음성 인식 스피커에 밑거름이 되어 맞춤형 콘텐츠 추천 등의 서비

스 확장에도 유용하게 쓰일 것으로 기대한다.

그림 81. 단통법 이후 통신 3사 IPTV 가입자 수 성장 추이 그림 82. LG유플러스의 TV 서비스: 음성 검색(상) 및 유투브 키즈(하)

주: 2014년 10월을 100으로 변환

자료: 각 사, 미래에셋대우 리서치센터

자료: 언론 종합, 미래에셋대우 리서치센터

100

125

150

175

200

14.10 15.3 15.8 16.1 16.6 16.11 17.4 17.9

(14.10=100)

KT

SK텔레콤

LG유플러스

Page 54: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

54 Mirae Asset Daewoo Research

LG유플러스 (032640)

예상 포괄손익계산서 (요약) 예상 재무상태표 (요약)

(십억원) 12/16 12/17F 12/18F 12/19F (십억원) 12/16 12/17F 12/18F 12/19F

매출액 11,451 12,090 12,187 12,406 유동자산 2,620 2,869 3,006 3,034

매출원가 0 0 0 0 현금 및 현금성자산 317 491 648 634

매출총이익 11,451 12,090 12,187 12,406 매출채권 및 기타채권 1,853 1,890 1,873 1,907

판매비와관리비 10,705 11,269 11,286 11,494 재고자산 262 288 285 290

조정영업이익 746 821 901 912 기타유동자산 188 200 200 203

영업이익 746 821 901 912 비유동자산 9,370 8,876 8,365 7,964

비영업손익 -103 -135 -119 -126 관계기업투자등 8 8 8 8

금융손익 -108 -96 -69 -46 유형자산 6,950 6,722 6,426 6,192

관계기업등 투자손익 1 0 0 0 무형자산 1,192 954 740 572

세전계속사업손익 643 686 782 786 자산총계 11,989 11,746 11,371 10,999

계속사업법인세비용 150 154 175 176 유동부채 3,574 3,302 3,079 2,925

계속사업이익 493 532 607 610 매입채무 및 기타채무 1,293 1,300 1,288 1,312

중단사업이익 0 0 0 0 단기금융부채 1,053 767 567 367

당기순이익 493 532 607 610 기타유동부채 1,228 1,235 1,224 1,246

지배주주 493 532 607 610 비유동부채 3,588 3,348 2,742 2,154

비지배주주 0 0 0 0 장기금융부채 2,926 2,682 2,082 1,482

총포괄이익 487 531 607 610 기타비유동부채 662 666 660 672

지배주주 487 531 607 610 부채총계 7,163 6,650 5,822 5,080

비지배주주 0 0 0 0 지배주주지분 4,826 5,095 5,549 5,919

EBITDA 2,400 2,643 2,811 2,714 자본금 2,574 2,574 2,574 2,574

FCF 941 1,103 1,110 1,027 자본잉여금 837 837 837 837

EBITDA 마진율 (%) 21.0 21.9 23.1 21.9 이익잉여금 1,414 1,683 2,137 2,507

영업이익률 (%) 6.5 6.8 7.4 7.4 비지배주주지분 0 0 0 0

지배주주귀속 순이익률 (%) 4.3 4.4 5.0 4.9 자본총계 4,826 5,095 5,549 5,919

예상 현금흐름표 (요약) 예상 주당가치 및 valuation (요약)

(십억원) 12/16 12/17F 12/18F 12/19F 12/16 12/17F 12/18F 12/19F

영업활동으로 인한 현금흐름 2,225 2,615 2,510 2,427 P/E (x) 10.1 10.2 8.9 8.9

당기순이익 493 532 607 610 P/CF (x) 2.0 2.0 2.0 2.1

비현금수익비용가감 2,052 2,150 2,154 2,023 P/B (x) 1.0 1.1 1.0 0.9

유형자산감가상각비 1,474 1,578 1,696 1,634 EV/EBITDA (x) 3.6 3.1 2.6 2.4

무형자산상각비 180 244 214 168 EPS (원) 1,129 1,218 1,391 1,397

기타 398 328 244 221 CFPS (원) 5,830 6,142 6,323 6,030

영업활동으로인한자산및부채의변동 -101 202 -8 16 BPS (원) 11,054 11,670 12,710 13,557

매출채권 및 기타채권의 감소(증가) -174 52 14 -29 DPS (원) 350 450 550 650

재고자산 감소(증가) 103 -30 3 -5 배당성향 (%) 31.0 36.9 39.6 46.5

매입채무 및 기타채무의 증가(감소) -12 -64 -3 5 배당수익률 (%) 3.1 3.6 4.4 5.2

법인세납부 -96 -172 -175 -176 매출액증가율 (%) 6.1 5.6 0.8 1.8

투자활동으로 인한 현금흐름 -1,492 -1,676 -1,399 -1,402 EBITDA증가율 (%) 7.1 10.1 6.4 -3.5

유형자산처분(취득) -1,272 -1,508 -1,400 -1,400 조정영업이익증가율 (%) 18.0 10.1 9.7 1.2

무형자산감소(증가) -201 -141 0 0 EPS증가율 (%) 40.2 7.9 14.2 0.4

장단기금융자산의 감소(증가) -13 -1 1 -2 매출채권 회전율 (회) 7.4 7.7 7.8 7.9

기타투자활동 -6 -26 0 0 재고자산 회전율 (회) 36.6 44.0 42.5 43.1

재무활동으로 인한 현금흐름 -707 -793 -953 -1,040 매입채무 회전율 (회) 0.0 0.0 0.0 0.0

장단기금융부채의 증가(감소) -596 -530 -800 -800 ROA (%) 4.1 4.5 5.3 5.5

자본의 증가(감소) 0 0 0 0 ROE (%) 10.6 10.7 11.4 10.6

배당금의 지급 -109 -262 -153 -240 ROIC (%) 6.6 7.6 8.8 9.5

기타재무활동 -2 -1 0 0 부채비율 (%) 148.4 130.5 104.9 85.8

현금의 증가 25 173 158 -15 유동비율 (%) 73.3 86.9 97.6 103.7

기초현금 292 317 491 648 순차입금/자기자본 (%) 74.7 57.0 35.0 19.6

기말현금 317 491 648 634 조정영업이익/금융비용 (x) 5.2 6.9 8.8 11.7

자료: LG유플러스, 미래에셋대우 리서치센터

Page 55: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 55

음성 인터페이스가 새로운 수요를 만든다

음성 인터페이스는 음악 스트리밍 서비스의 주요 사용자 층을 확대하며 새로운 성장을 견인할 전망

이다. 기존의 음악 스트리밍 서비스는 15~34세가 주요한 소비층이었다. 음성 인터페이스가 도

입되면 주력 소비층이 15세 미만(영/유아)과 35세 이상(부모)으로 확대될 것이다. 15세 미만

중에서도 특히 4~8세의 자판 입력이 불편하거나 불가능한 자녀를 위한 부모들의 가입이 기대

된다. 추가적으로 부엌 및 차량에서의 음성 인터페이스 사용을 위한 수요 증가도 기대할 수 있

다. T맵XNUGU의 서비스 개시를 통해 차량 내에서 멜론을 통한 음악 스트리밍 사용 수요가

더욱 빠르게 증가할 수 있을 것으로 판단한다.

미국을 통해 음원 시장 내 음성 인터페이스의 영향력을 확인할 수 있다. 2015년 하반기 아마존

이 인공지능 스피커 ‘에코’를 출시한 이후 2016년 미국의 음악 시장은 전년 대비 10%의 성장을

보였다. 1999년 210억달러에 달하던 미국의 음악 시장이 2015년 70억달러로 연평균 6.7%

의 꾸준한 하락세를 보인 점을 감안하면 에코의 효과는 더욱 명확하다고 판단한다.

SK텔레콤과의 제휴 강도는 더욱 강화될 것으로 예상

이동통신서비스 업체 입장에서 기존의 음악 스트리밍은 고가 가입자 유치를 위한 마케팅 도구

로 활용하는 부가 서비스에 불과했다. 음성 인식 스피커가 음성 인터페이스 시대의 핵심 단말 역

할을 수행하게 되면서 음악 스트리밍은 기본적으로 제공되는 주요 서비스 중에 하나가 되었다. 이

제는 통신사 입장에서도 음성 인터페이스 시장에서의 경쟁력 확보를 위해 음원 서비스 업체와

의 제휴가 필수적이다. 가입자 저변의 중요성을 감안하면 이미 시장 내 충분한 지배력을 보유

한 업체일수록 유리하다. 400만 이상의 유료가입자를 확보하고 있는 국내 1위 음원 서비스 업

체인 로엔이 매력적일 수 밖에 없는 이유이다. 따라서 지분 매각으로 인한 SK텔레콤과의 제휴

강도 약화 위험은 낮을 뿐만 아니라 오히려 더욱 강화될 수 있는 상황이라고 판단한다.

투자의견 '매수' 유지, 목표주가는 126,000원으로 상향 조정

로엔에 대한 투자의견 ‘매수’를 유지하고, 목표주가는 126,000원으로 상향 조정한다. 목표주가 상

향은 음성 인식 스피커 도입 효과를 적용하면서 2018년 실적 추정치를 상향 조정한 데에 기인

한다. 음성 인식 스피커 도입 영향으로 가입자 순증이 2배 수준으로 높아지는 것이 2개 분기

동안 확인되고 있다. 4분기에는 카카오미니가 가세하면서 가입자 순증 추세를 지속할 수 있을

것으로 기대한다.

로엔 (016170)

음성 인식 스피커를 통한 제 2의 성장기 진입

투자의견(유지) 매수

목표주가(12M,상향) ▲ 126,000원

현재주가(17/11/09) 104,400원

상승여력 21%

영업이익(17F,십억원) 104

Consensus 영업이익(17F,십억원) 103

EPS 성장률(17F,%) 27.8

MKT EPS 성장률(17F,%) 46.1

P/E(17F,x) 33.0

MKT P/E(17F,x) 10.5

KOSDAQ 709.94

시가총액(십억원) 2,640

발행주식수(백만주) 25

유동주식비율(%) 32.3

외국인 보유비중(%) 16.6

베타(12M) 일간수익률 0.23

52주 최저가(원) 71,100

52주 최고가(원) 111,500

주가상승률(%) 1개월 6개월 12개월

절대주가 19.5 17.3 46.4

상대주가 9.8 6.3 23.7

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억원) 323 358 451 575 658 746

영업이익 (십억원) 58 63 80 104 117 137

영업이익률 (%) 18.0 17.6 17.7 18.1 17.8 18.4

순이익 (십억원) 46 50 63 80 91 105

EPS (원) 1,801 1,983 2,477 3,165 3,582 4,145

ROE (%) 25.4 22.8 23.6 25.2 24.2 23.7

P/E (배) 24.4 42.4 30.6 33.0 29.1 25.2

P/B (배) 5.5 8.9 6.6 7.7 6.5 5.5

배당수익률 (%) 1.6 0.0 1.3 1.2 1.4 1.6

주: K-IFRS 연결 기준, 순이익은 지배주주 귀속 순이익

자료: 로엔, 미래에셋대우 리서치센터

[통신서비스/IoT]

이학무

02-3774-1785

[email protected]

하누리

02-3774-1653

[email protected]

80

100

120

140

160

180

16.11 17.3 17.7 17.11

로엔 KOSDAQ

Page 56: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

56 Mirae Asset Daewoo Research

새로운 플랫폼을 통한 추가 성장 기대

국내 음원 시장은 스마트폰 도입과 LTE 보급을 기반으로 1차 성장기를 보였다. 2009년 아이폰이

국내에 소개된 이후 스마트폰 가입자가 빠르게 증가하였고, 2012년에 LTE가 보급되면서 음악 스

트리밍을 안정적으로 더욱 편하게 사용할 수 있는 환경이 갖추어졌다. 2010년 1,900억원에 불과

했던 음원 시장은 2013년 3,400억원으로 성장하며 오프라인 음반 시장을 상회하였다. 이제 인공

지능 스피커라는 새로운 플랫폼에 주목해야 한다.

그림 83. 국내 음악 시장 규모 추이

자료: 로엔, 음악산업백서, 미래에셋대우 리서치센터

아마존 에코가 확인시켜 준 인공지능 스피커의 영향력

2015년 하반기 아마존이 인공지능 스피커 ‘에코’를 출시한 이후 2016년 미국의 음악 시장은 전년대비

10%의 성장을 보였다. 1999년 210억달러에 달하던 미국의 음악 시장이 2015년 70억달러로 연

평균 6.7%의 하락세를 꾸준히 보인 것을 감안하면 경이로운 일이며 그 중심에 아마존의 에코가

있는 것으로 판단한다.

아마존뮤직은 애플보다 8년 가량 늦은 2007~2008년에 음악 사업을 시작하였다. 사업 초기에는

음악 산업에서 의미 있는 영향력을 보이지 못했다. 2014년 프라임뮤직 출시 이후 점유율 증가가

본격화되었다. 이후 에코 출시를 통해 빠르게 지배력을 강화하면서 글로벌 음악 시장의 12% 점유율을

차지하게 되었다. 애플뮤직의 점유율이 19%인 것을 감안하면 아마존뮤직의 경쟁력에 에코의 기여

가 상당히 높다고 판단된다.

그림 84. 미국 AI 스피커 사용자 추이 그림 85. 미국 AI 스피커 M/S 그림 86. 글로벌 음원 스트리밍 업체 M/S

주: 2017년 5월 기준, 한 달에 1번 이상 스피커 사용자 기준

자료: eMarketer, Statista, 미래에셋대우 리서치센터

주: 2017년 4월 기준

자료: eMarketer, 미래에셋대우 리서치센터

주: 2017년 6월 기준

자료: Voicebot.ai, MIDia Research, 미래에셋대우 리서치센터

280 260 240 210265

130 130 125 130 130

1060

110180

190 340

435465

550

685

0

300

600

900

03 05 07 09 10 13 14 15 16 17F

(십억원)

음원 음반

2013년

디지털 음원 시장 규모

오프라인 음반 시장 상회

0

5

10

15

20

25

0

15

30

45

60

75

16 17F 18F 19F 20F 21F

(백만명) (%)

AI 스피커 사용자 (L)

AI 스피커 보급률 (R)

아마존

에코

70.6%

구글홈

23.8%

기타

5.6%Spotify

40%

애플

뮤직

19%

아마존

뮤직

12%

기타

29%

Page 57: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 57

음성 인식 스피커 보급을 통한 제 2의 성장기 진입에 대한 기대

시장이 형성되고 성장하기 위해서는 업체들 간의 치열한 경쟁이 필연적이다. 음성 인터페이스 시

장도 마찬가지이다. SK텔레콤은 2016년 9월에 국내 최초 인공지능 스피커 NUGU를 소개했다. 지

난 8월에는 작고 이동성이 있으면서 가격이 저렴한 NUGU mini를 출시하기도 했다. KT가 지난 1

월에 출시한 IPTV 셋탑박스 일체형 인공지능 스피커 ‘기가지니’도 있다. 출시 8개월만에 판매량이

20만대를 넘어서는 등 호조를 보이고 있다. LG유플러스는 네이버와의 제휴를 통해 연내로 인공지

능 스피커를 출시할 예정에 있다. 인터넷 업체들의 활약도 돋보인다. 네이버는 지난 8월에 ‘웨이

브’를 출시했고, 카카오는 10월에 ‘카카오미니’를 출시했다.

2015년은 LTE에 기반한 스마트폰의 대중화를 통해 음악 스트리밍 시장이 본격적인 성장을 보였

던 시기로서 인공지능 스피커 기반의 새로운 성장에 대한 가시성을 보이고 있는 현재와 상당히 유

사하다고 판단한다. 아직은 시장 초기 단계로서 음원 시장에 미치는 영향이 크지는 않지만, 플랫폼

사업자들이 경쟁적으로 음성 인식 스피커를 출시하고 있는 것에 주목할 필요가 있다. 다양한 음성

인식 스피커의 보급은 음원 스트리밍 시장을 확대시키는 데에 기여할 수 있을 것으로 예상한다.

스피커의 주요 사용처 중에 주요한 것이 음악 감상이라는 점을 감안하면 음성 인터페이스 도입에 따른

음원 서비스 업체의 직접적인 수혜가 기대된다. 시장 초기에는 규모의 경제를 갖춘 기업이 유리하다.

이에 약 400만 유료 가입자를 보유하고 있는 로엔의 수혜가 가장 클 것으로 예상한다. 또한 사업자간

제휴의 측면에서도 로엔이 돋보인다. 콘텐츠 제공자의 경쟁력은 플랫폼 사업자와의 제휴에 달려있

다. 로엔은 국내 1위 음원 서비스 업체로서 국내 무선통신 1위 사업자인 SK텔레콤과 긴밀한 관계

를 구축하고 있으며, 국내 월 이용자 수가 약 4,500만명에 달하는 카카오톡을 모회사로 두었다.

음원 스트리밍 플랫폼인 멜론은 이미 SK텔레콤과 카카오의 음성 인식 스피커에 탑재되어 있다.

표 9. 국내 음성 인식 스피커 출시 현황 및 예정

사업자 디바이스 출시일 음원

SK텔레콤 누구 2016.9 멜론

KT 기가지니 2017.1 지니뮤직

네이버 웨이브 2017.8 네이버뮤직

SK텔레콤 누구 미니 2017.8 멜론

카카오 카카오미니 2017.10 멜론

LG유플러스 출시 예정 4Q17F 지니뮤직

주: 출시일 순으로 정렬

자료: 언론 종합, 미래에셋대우 리서치센터

그림 87. T맵XNUGU 앱을 통한 음악 스트리밍 서비스 멜론 구동 화면

자료: SK텔레콤, 미래에셋대우 리서치센터

Page 58: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

58 Mirae Asset Daewoo Research

로엔 (016170)

예상 포괄손익계산서 (요약) 예상 재무상태표 (요약)

(십억원) 12/16 12/17F 12/18F 12/19F (십억원) 12/16 12/17F 12/18F 12/19F

매출액 451 575 658 746 유동자산 344 374 420 456

매출원가 0 0 0 0 현금 및 현금성자산 92 73 89 95

매출총이익 451 575 658 746 매출채권 및 기타채권 75 87 100 105

판매비와관리비 371 471 541 609 재고자산 0 0 0 1

조정영업이익 80 104 117 137 기타유동자산 177 214 231 255

영업이익 80 104 117 137 비유동자산 110 114 127 136

비영업손익 3 4 8 7 관계기업투자등 0 0 0 0

금융손익 3 3 4 4 유형자산 37 40 44 49

관계기업등 투자손익 0 0 0 0 무형자산 44 43 51 53

세전계속사업손익 83 108 125 144 자산총계 454 488 548 592

계속사업법인세비용 21 27 31 36 유동부채 148 133 127 102

계속사업이익 62 80 90 104 매입채무 및 기타채무 89 95 90 65

중단사업이익 0 0 0 0 단기금융부채 0 2 2 2

당기순이익 62 80 90 104 기타유동부채 59 36 35 35

지배주주 63 80 91 105 비유동부채 3 4 4 5

비지배주주 -1 -1 0 0 장기금융부채 0 0 0 0

총포괄이익 55 79 90 104 기타비유동부채 3 4 4 5

지배주주 55 80 91 105 부채총계 151 136 132 107

비지배주주 -1 -1 0 0 지배주주지분 292 342 407 477

EBITDA 102 128 141 163 자본금 13 13 13 13

FCF 71 56 74 72 자본잉여금 57 52 52 52

EBITDA 마진율 (%) 22.6 22.3 21.4 21.8 이익잉여금 227 282 347 415

영업이익률 (%) 17.7 18.1 17.8 18.4 비지배주주지분 10 9 9 8

지배주주귀속 순이익률 (%) 14.0 13.9 13.8 14.1 자본총계 302 351 416 485

예상 현금흐름표 (요약) 예상 주당가치 및 valuation (요약)

(십억원) 12/16 12/17F 12/18F 12/19F 12/16 12/17F 12/18F 12/19F

영업활동으로 인한 현금흐름 97 62 82 80 P/E (x) 30.6 33.0 29.1 25.2

당기순이익 62 80 90 104 P/CF (x) 19.0 20.5 18.7 16.3

비현금수익비용가감 39 49 51 58 P/B (x) 6.6 7.7 6.5 5.5

유형자산감가상각비 4 5 3 4 EV/EBITDA (x) 16.6 18.8 16.9 14.6

무형자산상각비 18 19 20 22 EPS (원) 2,477 3,165 3,582 4,145

기타 17 25 28 32 CFPS (원) 4,001 5,083 5,573 6,411

영업활동으로인한자산및부채의변동 11 -40 -32 -51 BPS (원) 11,579 13,531 16,109 18,826

매출채권 및 기타채권의 감소(증가) -14 -14 -12 -5 DPS (원) 1,004 1,258 1,428 1,653

재고자산 감소(증가) 0 0 0 0 배당성향 (%) 40.9 40.0 40.0 40.0

매입채무 및 기타채무의 증가(감소) 23 6 -4 -25 배당수익률 (%) 1.3 1.2 1.4 1.6

법인세납부 -18 -29 -31 -36 매출액증가율 (%) 26.0 27.5 14.4 13.4

투자활동으로 인한 현금흐름 -89 -51 -41 -37 EBITDA증가율 (%) 22.9 25.5 10.2 15.6

유형자산처분(취득) -26 -7 -8 -8 조정영업이익증가율 (%) 27.0 30.0 12.5 17.1

무형자산감소(증가) -15 -16 -28 -24 EPS증가율 (%) 24.9 27.8 13.2 15.7

장단기금융자산의 감소(증가) -37 -27 -5 -5 매출채권 회전율 (회) 6.9 7.2 7.2 7.4

기타투자활동 -11 -1 0 0 재고자산 회전율 (회) 1,191.2 1,443.9 1,430.1 1,394.4

재무활동으로 인한 현금흐름 1 -30 -26 -36 매입채무 회전율 (회) 0.0 0.0 0.0 0.0

장단기금융부채의 증가(감소) 0 2 0 0 ROA (%) 15.2 16.9 17.4 18.3

자본의 증가(감소) 0 -5 0 0 ROE (%) 23.6 25.2 24.2 23.7

배당금의 지급 0 -25 -25 -36 ROIC (%) 141.1 117.0 80.1 63.9

기타재무활동 1 -2 -1 0 부채비율 (%) 50.1 38.8 31.6 22.1

현금의 증가 9 -19 16 6 유동비율 (%) 232.3 282.1 329.8 445.4

기초현금 83 92 73 89 순차입금/자기자본 (%) -80.2 -70.5 -64.2 -57.1

기말현금 92 73 89 95 조정영업이익/금융비용 (x) 503.5 686.9 587.2 685.7

자료: 로엔, 미래에셋대우 리서치센터

Page 59: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 59

핵심 자회사와 본업 가치 재반영, 목표주가 109,000원으로 상향

목표주가를 109,000원(기존 102,000원)으로 상향한다. 지분 보유량이 큰 자회사(넷마블게임

즈)의 주가 상승과 상장을 앞둔 자회사(11/24, 스튜디오드래곤)에 대한 가치 평가가 동사 주가

의 중요 변수가 됐다. 넷마블게임즈 주주가치(2.4조원, 30% 할인)와, 스튜디오드래곤 주주가치(밴

드 중간값, 지분율 고려 0.7조원)에 본업가치 1.1조원(본업 NOPLAT에 16.7x)을 합산했다.

2018년 TV 광고 +15% 가이던스가 암시하는 바: 최상의 시나리오 가능성

3분기 실적 발표와 함께 동사는 연간 영업이익 가이던스를 기존 1,000억원에서 900억원으로

10% 낮췄다. 방송 광고 시장 전망치 하향에 기인한다고 밝혔다. 그러나 4분기 영화 개봉작(3

개) 중 흥행이 기대에 못 미친 두 작품(남한산성, 침묵)과, 가이던스 기준 진행률(영업이익

59.1%)을 고려하면, 흑자부문(방송, 음악)의 4분기에 대한 우려는 이르다는 판단이다.

한편 2018년 광고 매출 +15% 전망은 방송 광고 시장 반등과 동사 아웃퍼폼을 가정한 수치로

보인다. 인터넷 매체의 방송 광고 잠식을 감안하면 공격적인 전망일 수 있다. 그러나 대작이 포

함된 주력 채널, 경쟁력이 강화된 2nd-tier 채널 콘텐츠 라인업에 대한 자신감으로 풀이한다.

동사 TV 광고 반등은 제작 자회사 스튜디오드래곤의 이익률 지속 상승에도 중요하다. 자회사의 전

방 채널로서, 현행 방영권 거래 구조를 안정적으로 지속하기 위해서는 동사 본업 개선도 필요

하기 때문이다. 1) 광고 시장 개선에 힘입은 동사 광고 성장세 반등, 2) 동사와 자회사 간 안정적인

제작 구조 지속, 3) 보다 적극적인 다채널향 콘텐츠 판매(자회사)는 양사가 함께 성장하는 최상의 시

나리오다. 중국 시장에 대한 수출까지 재개되면 합산 레버리지는 더욱 커진다.

음성 인식 스피커 환경에서도 수혜자

인공지능 발달로 음성 인터페이스 시대가 열리고 있다. TV, 모바일 등 콘텐츠 이용 기기 조작

이 크게 편리해질 전망이다. 자유소비재인 콘텐츠에 대한 전체 소비량이 증가할 가능성이 높다.

편의성 개선에 따른 미디어 소비 증가는 과거 PC와 모바일 출현 때도 경험했던 일이다.

스피커 환경 하에 가속되는 3가지 흐름의 최전방에 동사가 자리한다. 1) 유료 판매 상품으로서

콘텐츠의 가치 부각(동사 IP 보유 VoD 이용 증가), 2) 다양한 플랫폼에 대한 접근성이 골고루

높아지는 것(지상파 등 선순위 채널 의존도 감소), 3) 비주류 콘텐츠 장르(국내 1위 MCN DIA

TV 보유)가 조명 받는 것 등이다. 접근성보다 콘텐츠 경쟁력이 중요해지는 환경에서 동사의 브

랜드 가치는 재평가 받을 가능성이 높다.

CJ E&M (130960)

우주가 나서서 돕고 있다

미디어

투자의견(유지) 매수

목표주가(12M,상향) 109,000원

현재주가(17/11/09) 87,100원

상승여력 25%

영업이익(17F,십억원) 86

Consensus 영업이익(17F,십억원) 88

EPS 성장률(17F,%) 685.6

MKT EPS 성장률(17F,%) 46.4

P/E(17F,x) 6.9

MKT P/E(17F,x) 10.5

KOSDAQ 709.94

시가총액(십억원) 3,374

발행주식수(백만주) 39

유동주식비율(%) 56.7

외국인 보유비중(%) 28.6

베타(12M) 일간수익률 1.41

52주 최저가(원) 53,800

52주 최고가(원) 89,400

주가상승률(%) 1개월 6개월 12개월

절대주가 12.8 2.7 29.0

상대주가 3.7 -6.9 9.0

결산기 (12월) 12/13 12/14 12/15 12/16 12/17F 12/18F

매출액 (십억원) 1,188 1,233 1,347 1,538 1,767 1,974

영업이익 (십억원) -8 -13 53 28 86 138

영업이익률 (%) -0.7 -1.1 3.9 1.8 4.9 7.0

순이익 (십억원) 5 225 54 62 488 166

EPS (원) 133 5,796 1,403 1,605 12,606 4,281

ROE (%) 0.4 16.4 3.6 4.0 27.2 7.8

P/E (배) 229.0 6.6 57.4 44.2 6.9 20.3

P/B (배) 1.0 1.0 2.0 1.8 1.7 1.5

배당수익률 (%) 0.0 0.0 0.2 0.3 0.2 0.2

주: K-IFRS 연결 기준, 순이익은 지배주주 귀속 순이익

자료: CJ E&M, 미래에셋대우 리서치센터

[미디어/엔터/레저]

박정엽

02-3774-1652

[email protected]

70

90

110

130

150

16.11 17.3 17.7 17.11

CJ E&M KOSDAQ

Page 60: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

60 Mirae Asset Daewoo Research

Valuation 및 실적 전망

3Q17 Review: 음악 호실적, 방송 부진

3분기 연결 매출액 4,401억원(+16.2% YoY, 이하 동), 영업이익 127억원(+316.0%)을 기록했다.

실적 발표 전 170억원대였던 컨센서스 영업이익을 크게 하회했다. 전년비 광고 매출액 반등

(+5.7%)에도 방송 콘텐츠 제작비용 증가와 해외 자회사 손실이 일시 확대된 결과다. 음악 부문은

68억원의 영업이익(+179.6%)으로 서프라이즈를 기록했다. ‘워너원’, ‘쇼미더머니’ 등이 흥행에 크

게 성공하며 방송 부문과의 시너지가 본격화된 결과다.

표 10. CJ E&M 적정 가치 산정: 자회사 및 본업 가치 합산 (십억원)

Valuation – SOTP (자회사 가치)

현재주가 (원) 87,100

발행주식수 (백만주) 38.7

시가총액 (십억원) 3,373.6

1. 상장 자회사 가치 3,097 1. = (a)+(b)

(a) 넷마블 지분 가치 2,437

현 시가총액 15,813

지분율 적용 & 할인 2,437.5 보유지분 22.0% & 30% 할인

(b) 스튜디오드래곤 지분 가치 659

공모가 기준 시가총액 924 공모밴드 중간값

지분율 적용 659.1 상장 후 보유지분 71.3%

2. 상장 자회사 제외한 가치 1,127

18F NOPLAT(드래곤 제외) 68

Target P / NOPLAT 16.7 미국 미디어/콘텐츠 3개사 평균 P/E 적용

총 적정 주주가치 (c) 4,224 1. + 2.

목표주가 (원) 109,048 (c) / 주식 수

상승여력 (%) 25.2

주: 미국 전통 미디어 3개사는 Walt Disney, Comcast, Time Warner

자료: 미래에셋대우 리서치센터

표 11. CJ E&M 적정 가치 산정: 사업 부문별 가치 합산 (십억원, x, %)

Valuation - EV/EBIT (18F) 세부 내용

방송 적정 EV (a) 1,618

EBIT 120

Target EV/EBIT 13.5 미국 미디어/콘텐츠 3개사 평균 멀티플 20% 할증

영화 적정 EV (b) 290 상장 대형 배급사 시가총액 중간값 적용

EBIT -3

Target EV/EBIT -

음악 적정 EV (c) 366

EBIT 23

Target EV/EBIT 16.1 로엔 멀티플 20% 할인 적용

넷마블 지분 가치 (d) 2,446

시가총액 15,813

지분율 적용 & 할인 2,446.3 보유지분 22.1% & 30% 할인 적용

총 적정 EV (e) 4,721 (a)+(b)+(c)+(d)

연결 순차입금 (f) 501

총 주주가치 (g) 4,220 (e)-(f)

목표주가 (원) 108,963 (g) / 주식 수

상승여력 (%) 25.1

주: 미국 전통 미디어 3개사는 Walt Disney, Comcast, Time Warner

자료: 미래에셋대우 리서치센터

Page 61: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 61

표 12. CJ E&M 분기 및 연간 실적 전망 (십억원, %, 백만명, %p)

1Q16 2Q16 3Q16 4Q16 1Q17 2Q17 3Q17P 4Q17F 2016 2017 2018F

매출액 314 357 379 489 394 425 440 507 1,538 1,767 1,974

방송 225 268 269 366 286 332 317 391 1,128 1,326 1,502

광고 110 132 111 135 108 129 117 140 488 494 521

수신료 47 47 47 56 49 49 51 56 197 205 200

콘텐츠판매&기타 69 89 111 175 128 154 149 196 443 627 781

영화 40 41 56 52 57 45 48 34 190 183 179

극장 28 26 39 34 47 19 23 18 127 106 93

부가판권 6 7 8 6 4 10 12 5 27 31 27

기타(수출) 7 8 9 12 6 16 12 11 36 45 59

음악 45 47 46 61 47 47 66 75 199 235 273

공연 3 1 8 9 5 2 9 7 21 22 19

영업비용 305 343 376 487 371 402 427 481 1,510 1,681 1,836

영업이익 9 14 3 2 23 24 13 26 28 86 138

영업이익률 2.8 4.0 0.8 0.4 5.9 5.6 2.9 5.1 1.8 4.9 7.0

방송 5 20 9 12 20 24 9 40 46 93 120

영화 4 -7 -7 -14 2 -2 -2 -20 -24 -22 -3

음악 0 1 2 4 2 2 7 7 7 18 23

공연 0 -1 -1 0 -1 -1 -2 -1 -2 -4 -2

세전이익 15 48 9 -4 45 537 21 42 68 645 205

당기순이익 12 43 2 3 33 405 16 33 61 488 164

순이익률 4.0 12.0 0.6 0.6 8.5 95.1 3.7 6.6 4.0 27.6 8.3

YoY

매출액 7.0 19.4 2.4 27.0 25.7 19.1 16.2 3.7 14.2 14.8 11.7

방송 26.7 20.1 18.0 30.5 26.8 23.7 18.1 6.9 24.1 17.5 13.3

영화 -38.9 28.9 -39.6 9.7 40.2 9.6 -15.4 -34.3 -20.5 -3.4 -2.1

음악 6.3 9.4 -4.8 21.6 6.4 -0.2 43.5 21.4 8.3 18.1 15.9

공연 -55.7 3.0 935.9 44.0 39.8 50.7 15.0 -25.0 36.8 3.7 -11.0

영업이익 -2.9 -20.8 -77.5 -84.4 162.3 67.2 316.0 1,284.4 -46.9 206.5 60.8

당기순이익 -86.2 240.9 -91.3 흑전 168.1 845.1 579.5 961.1 15.0 701.8 -66.3

주요 가정

방송 광고 시장 697 863 797 963 701 867 801 967 3,319 3,336 3,403

케이블 229 284 262 317 228 282 260 315 1,092 1,085 1,081

지상파 291 360 333 402 293 363 335 405 1,386 1,395 1,351

극장 관객 수 49 45 72 50 52 45 64 53 217 214 218

CJ E&M 점유율 16.2 16.2 16.7 19.7 26.0 12.3 12.0 13.8 17.2 15.9 18.0

주: K-IFRS 연결 기준

자료: CJ E&M, 미래에셋대우 리서치센터

표 13. 연결 실적 추정치 변경 (십억원, %, %p)

변경 전 변경 후 변경률 변경 근거

17F 18F 17F 18F 17F 18F

매출액 1,734 1,850 1,767 1,974 1.9 6.7 3분기 실적 변수 반영 및 18F 방송 광고 시장 전망치 상향

영업이익 97 127 86 138 -11.6 8.5

순이익 498 157 488 164 -2.0 4.6

영업이익률 5.6 6.9 4.9 7.0 -0.7 0.1

순이익률 28.7 8.5 27.6 8.3 -1.1 -0.2

주: K-IFRS 연결 기준

자료: 미래에셋대우 리서치센터

Page 62: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

62 Mirae Asset Daewoo Research

스피커 환경 수혜 기대

그림 88. 음성 인식 도입은 콘텐츠 소비를 자극하고 미디어 환경 변화를 가속할 것

자료: 미래에셋대우 리서치센터

그림 89. 기가지니(스피커) 이용 시 콘텐츠 소비 증가 그림 90. 음성 인식 스피커의 조작 편의성이 월등히 좋다

자료: KT, 미래에셋대우 리서치센터 자료: 미래에셋대우 리서치센터

그림 91. 진정한 ‘네이티브 광고’로서 효율이 높은 MCN 콘텐츠 그림 92. DIA TV 영향력 강화

자료: Youtube, 미래에셋대우 리서치센터 자료: 언론 자료 종합, 미래에셋대우 리서치센터

0

50

100

150

200

250

300

350

시청시간(일평균) VOD 시청시간(일평균)

UHD

GiGA Genie

(분) UHD 대비

GiGA Genie TV는

+16.4% 초과 시청

UHD 대비

GiGA Genie

주문형 비디오는

+36.4% 초과 시청 0

5

10

15

20

25

30

아이폰 터치 올레tv

리모컨

Nugu

스피커

아이폰 터치 PC 마우스,

키보드

Nugu

스피커

VoD 음원

(회)

VoD와 음원 재생을 위한

입력 횟수는

음성 인식 스피커에서

월등히 작음

0

20

40

60

80

100

120

0

200

400

600

800

1,000

1,200

1,400

1,600

15.5 15.11 16.5 16.11 17.5

월 조회수 (L)

누적 구독자수 (R)

(십억회) (백만명)

Page 63: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 63

CJ E&M (130960)

예상 포괄손익계산서 (요약) 예상 재무상태표 (요약)

(십억원) 12/15 12/16 12/17F 12/18F (십억원) 12/15 12/16 12/17F 12/18F

매출액 1,347 1,538 1,767 1,974 유동자산 940 996 1,647 1,962

매출원가 1,019 1,190 1,311 1,435 현금 및 현금성자산 47 81 698 847

매출총이익 328 348 456 539 매출채권 및 기타채권 431 550 571 671

판매비와관리비 275 321 370 401 재고자산 4 5 5 6

조정영업이익 53 28 86 138 기타유동자산 458 360 373 438

영업이익 53 28 86 138 비유동자산 1,425 1,797 1,790 1,747

비영업손익 6 40 559 67 관계기업투자등 495 463 480 564

금융손익 -5 -9 -9 -6 유형자산 77 275 283 267

관계기업등 투자손익 129 81 595 90 무형자산 653 724 674 528

세전계속사업손익 59 68 645 205 자산총계 2,365 2,793 3,436 3,708

계속사업법인세비용 6 7 157 41 유동부채 642 937 921 1,025

계속사업이익 53 61 488 164 매입채무 및 기타채무 262 311 323 379

중단사업이익 0 0 0 0 단기금융부채 177 370 333 334

당기순이익 53 61 488 164 기타유동부채 203 256 265 312

지배주주 54 62 488 166 비유동부채 162 240 404 416

비지배주주 -1 -1 0 -2 장기금융부채 132 174 336 336

총포괄이익 52 -42 507 164 기타비유동부채 30 66 68 80

지배주주 54 -41 507 164 부채총계 805 1,177 1,326 1,441

비지배주주 -2 -1 0 0 지배주주지분 1,551 1,547 2,037 2,196

EBITDA 373 428 368 301 자본금 194 194 194 194

FCF 287 46 120 292 자본잉여금 973 973 973 973

EBITDA 마진율 (%) 27.7 27.8 20.8 15.2 이익잉여금 370 420 892 1,050

영업이익률 (%) 3.9 1.8 4.9 7.0 비지배주주지분 9 69 73 71

지배주주귀속 순이익률 (%) 4.0 4.0 27.6 8.4 자본총계 1,560 1,616 2,110 2,267

예상 현금흐름표 (요약) 예상 주당가치 및 valuation (요약)

(십억원) 12/15 12/16 12/17F 12/18F 12/15 12/16 12/17F 12/18F

영업활동으로 인한 현금흐름 295 259 136 292 P/E (x) 57.4 44.2 6.9 20.3

당기순이익 53 61 488 164 P/CF (x) 8.1 6.4 8.5 9.0

비현금수익비용가감 332 366 -89 210 P/B (x) 2.0 1.8 1.7 1.5

유형자산감가상각비 14 16 18 17 EV/EBITDA (x) 8.3 7.5 9.0 10.5

무형자산상각비 306 384 264 146 EPS (원) 1,403 1,605 12,606 4,281

기타 12 -34 -371 47 CFPS (원) 9,938 11,014 10,297 9,651

영업활동으로인한자산및부채의변동 -42 -168 -230 -35 BPS (원) 40,188 40,052 52,733 56,815

매출채권 및 기타채권의 감소(증가) -68 -76 -1 -91 DPS (원) 200 200 200 200

재고자산 감소(증가) -1 -1 0 -1 배당성향 (%) 14.6 12.7 1.6 4.7

매입채무 및 기타채무의 증가(감소) 56 1 -34 23 배당수익률 (%) 0.2 0.3 0.2 0.2

법인세납부 -56 0 -24 -41 매출액증가율 (%) 9.2 14.2 14.9 11.7

투자활동으로 인한 현금흐름 -189 -534 -187 -52 EBITDA증가율 (%) 28.6 14.7 -14.0 -18.2

유형자산처분(취득) -8 -212 -16 0 조정영업이익증가율 (%) - -47.2 207.1 60.5

무형자산감소(증가) -331 -358 -135 0 EPS증가율 (%) -75.8 14.4 685.4 -66.0

장단기금융자산의 감소(증가) 158 134 -11 -52 매출채권 회전율 (회) 3.6 3.4 3.5 3.5

기타투자활동 -8 -98 -25 0 재고자산 회전율 (회) 294.2 357.1 369.0 372.2

재무활동으로 인한 현금흐름 -94 306 115 -7 매입채무 회전율 (회) 11.7 10.1 10.0 9.9

장단기금융부채의 증가(감소) -93 236 125 0 ROA (%) 2.2 2.4 15.7 4.6

자본의 증가(감소) 0 0 0 0 ROE (%) 3.6 4.0 27.2 7.8

배당금의 지급 0 -8 -15 -8 ROIC (%) 5.3 2.3 4.9 9.2

기타재무활동 -1 78 5 1 부채비율 (%) 51.6 72.9 62.8 63.6

현금의 증가 14 34 617 148 유동비율 (%) 146.4 106.2 178.7 191.4

기초현금 34 47 81 698 순차입금/자기자본 (%) -3.3 23.0 -5.8 -12.7

기말현금 47 81 698 847 조정영업이익/금융비용 (x) 3.8 2.3 6.1 9.4

자료: CJ E&M, 미래에셋대우 리서치센터

Page 64: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

64 Mirae Asset Daewoo Research

음성 검색의 확대는 구글에게 단기적 리스크

음성 검색의 확대는 구글의 검색 광고 사업에 일부 리스크로 작용할 가능성이 있다. 음성 검색

이 1) 검색 쿼리 점유율 변동과 2) 수익 모델의 변화를 야기할 수 있기 때문이다. 음성 검색으

로 인해 사용자의 검색 경로가 PC나 모바일이 아닌 음성 인식 AI가 내장된 하드웨어로 일부

이탈할 것으로 예상한다 (2016년 기준 구글 모바일 검색 중 20%가 음성). 이는 검색 쿼리의

점유율의 변화로 이어질 수 있다. 또한 구글의 수익 모델인 검색 CPC (Cost per Click)의 변동

도 가능하다. PC, 모바일 검색과는 달리 클릭을 통한 수익 모델 구축이 어렵기 때문이다. 결국

구글은 음성 검색 기반의 신규 수익 모델 창출 (ex. CPM, CPA, CPS)이 필요하며 또한 광고

효율 개선을 위한 투자 (ex. 생태계 확보)가 필수적이다.

그러나, 음성 검색은 중장기적으로 결국 추가 성장 동력

그러나 음성 검색의 확대는 결국 중장기적으로 구글에게 추가 성장 동력으로 자리잡을 전망이

다. 음성 검색은 1) 다양한 하드웨어에 적용되어 사용자와 접점을 늘릴 수 있고 2) 이에 검색

쿼리 횟수가 증가할 수 있기 때문이다. 음성 인식 AI는 하드웨어에 구애받지 않고 다양한 기기

에 내장 가능하다. 하드웨어 자체가 아닌 온라인을 통한 클라우드 기반의 데이터 처리가 이뤄

지기 때문이며, 이를 통해 사용자와의 접점을 극대화시킬 수 있다. 또한 접점의 증가는 사용자

의 의존도를 심화시킬 수 있어 전체 검색 쿼리의 양을 확대시킬 수 있다. PC에서 모바일로 하

드웨어가 전환될 때 검색 쿼리가 증가한 것과 유사하다. 이는 온라인 시장의 확대를 의미하며

구글의 침투가능 시장의 범위의 확대로 이어질 전망이다.

구글, 향후 음성 검색 시장 경쟁력 확보 예상

구글은 현재 아마존 대비 열세인 음성 검색 시장에서의 경쟁력 확보가 가능할 전망이다. 1) 검

색 경쟁력을 기반으로 서비스의 사용성에 우위를 확보할 수 있다. 음성 검색의 특성상 ‘자연어

이해’와 답변의 정확도 확보가 필수적인데 구글은 검색 데이터를 기반으로 문제 해결이 가능하

다. 2) 또한 핵심 콘텐츠 확보로 사용자 확대가 가능하다. 구글은 유튜브와 지메일 등 핵심 콘

텐츠를 확보하고 있어 이를 활용한 사용자 확보 및 유지가 가능할 전망이다.

단기적으로 음성 검색 시장의 확대는 검색 광고 수익 모델 확보에 대한 우려가 제기될 수 있으

며 클릭수 증가율의 둔화로 이어질 수 있다. 그러나 현재 음성 검색 시장은 아직 초기 단계이

고 2000년대 초반 검색 광고 수익화 또한 트래픽 확보 (ex. 지식 검색) 이후 고도화가 지속됐

다는 점을 감안하면 결국 음성 검색 또한 향후 CPA, CPS 등으로 수익화가 가능할 전망이다.

알파벳 Alphabet (GOOGL US)

음성 검색 시장 경쟁력 확보 예상

Bloomberg

목표주가평균 USD 1,181.62

현재주가 (17/11/09) USD 1,047.72

국가 미국

거래소 NASDAQ

상승여력 12.8%

Bloomberg Rating

매수 보유 매도

83% 15% 3%

EPS 성장률 (17F,%) 17.4

P/E (17F,x) 32.2

MKT P/E (17F,x) 19.4

배당수익률 (%) 0.0

시가총액 (백만USD) 721.818

시가총액 (조원) 807.0

유동주식수 (백만주) 707.4

52주 최저가 (USD) 743.59

52주 최고가 (USD) 1,063.62

주가상승률(%) 1개월 6개월 12개월

절대주가 5.6 9.5 30.1

상대주가 4.2 1.7 9.1

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억USD) 66.0 75.0 90.3 110.2 131.4 153.9

영업이익 (십억USD) 16.5 19.4 23.7 27.3 36.6 43.0

영업이익률 (%) 25.0 25.8 26.3 24.7 27.9 28.0

순이익 (십억USD) 14.2 16.3 19.5 22.9 30.5 35.8

EPS (USD) 20.04 22.82 27.70 32.52 42.84 49.63

ROE (%) 14.8 14.5 15.0 15.0 16.5 15.9

P/E (배) 27.9 34.0 26.8 32.2 24.5 21.1

P/B (배) 3.7 4.5 3.7 4.5 3.7 3.1

주: GAAP

자료: 아마존, Bloomberg, 미래에셋대우 리서치센터

[글로벌 인터넷]

정용제 Yongjei Jeong, CFA 02-3774-1938

[email protected]

80

90

100

110

120

130

140

16.1 16.7 17.1 17.7

GOOGL NASDAQ

Page 65: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 65

그림 93. 주요 검색 엔진별 음성 검색 비중 그림 94. 미국 주요 매체별 사용 시간 점유율 전망

자료: 각 사 발표 자료, 미래에셋대우 리서치센터 자료: 이마케터, 미래에셋대우 리서치센터

그림 95. 미국 음성 인식 스피커 사용자 점유율 (2017년 4월) 그림 96. 주요 음성 인식 AI별 답변률 및 답변의 정확도 측정

자료: 이마케터, 미래에셋대우 리서치센터 자료: Stone Temple, 미래에셋대우 리서치센터

그림 97. Made by Google 하드웨어 라인업

자료: 구글, 미래에셋대우 리서치센터

40 38 37 35 34 33 32 32

13 19 22 24 26 27 28 29

0

10

20

30

40

50

60

70

80

90

100

2012 2014 2016 2018E

(%)

Others

Radio

Print

Mobile

PC

TV

20

10

25

0

10

20

30

40

50

60

70

80

90

구글 모바일 검색 중 바이두 전체 검색 중 빙 전체 검색 중

(%)

글로벌 검색엔진 점유율

음성 검색 비중

71

24

6

(%)

아마존 에코

구글 홈

기타

82

62

87

91

97

57

22

21

68

74

0 20 40 60 80 100

코타나

시리

알렉사

구글

어시스턴트

구글 검색

(%)

답변률

답변의 정확도

Page 66: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

66 Mirae Asset Daewoo Research

음성 인식 AI의 확대는 아마존에게 기회

음성 인식 AI의 확대는 아마존에게 기회 요소로 작용할 전망이다. 1) 각종 편의 기능과 신규

하드웨어를 통해 사용자와의 접점을 늘릴 수 있으며 2) 이를 통해 아마존에 대한 고객 충성도

를 심화시킬 수 있기 때문이다.

아마존 알렉사는 사용 기능과 쇼핑을 장점으로 알렉사 내장 하드웨어의 보급률 상승에 기여할

전망이다. 알렉사의 사용 가능한 기능 (Skills)은 10월 기준 2.5만개를 상회한다. 이는 구글 어

시스턴트의 약 500개 대비 높다. 또한 아마존은 알렉사를 통해 ‘쇼핑’ (ex. 프라임 데이 쇼핑)

을 가능하게 함으로써 사용 빈도를 극대화 시킬 수 있다. 이러한 기능은 알렉사의 사용성을 극

대화 시킬 수 있으며 알렉사가 내장된 다양한 기기 (ex. 에코, 대시, 스마트폰)의 보급 확대로

이어질 전망이다.

사용성의 개선과 보급률의 확대는 곧 소비자의 아마존에 대한 충성도를 심화시킬 수 있다. 충

성도의 개선은 소비자의 구매 빈도 증가로 이어질 것으로 예상되며 이는 곧 거래 금액 증가에

기여할 것으로 예상된다. 또한 충성도 심화는 소비자 확보를 위한 광고 플랫폼 의존도에 대한

감소에 기여할 수 있다. 스킬과 쇼핑 등의 차별화 서비스가 독자적으로 사용자를 확보할 수 있

는 콘텐츠의 역할을 수행할 수 있기 때문이다. 이는 전자상거래 구매 단계의 핵심인 소비자 확

보 (Acquisition) 및 유지 (Retention)의 효율화가 예상된다.

아마존, 음성 쇼핑을 통한 거래금액 확대 예상

아마존은 음성 쇼핑을 통해 향후 거래 금액 성장과 수익성 개선에 기여할 것으로 예상된다.

1) 소비자와의 접점 확대로 구매 빈도를 확대시킬 수 있다. 특히 일상 생활에서 사용 빈도 증

가는 ‘대시 버튼’, ‘프라임 나우’, ‘홀푸드’와 협력을 통해 아마존이 집중하고 있는 일용소비재

(FMCG: Fast Moving Consumer Goods) 시장의 잠식으로 나타날 것으로 예상된다. 2) 또한

아마존에 대한 고객 충성도 개선은 중장기적으로 수익성 개선에 긍정적이다. 최초 확보한 소비

자를 대상으로 차별화된 콘텐츠 제공을 통해 지속 유지시킬 수 있어 신규 소비자 확보에 필요

한 마케팅비 증가율 둔화로 이어질 것으로 판단한다(=Life Time Value의 개선).

최근 구글의 음성인식 AI 사업 확대로 인한 소비자 확보 경쟁이 이어질 가능성이 존재한다. 이

는 음성, 영상 콘텐츠에 대한 투자 확대로 이어지며 단기적으로 비용 상승의 원인으로 작용할

전망이다. 그러나 아마존의 궁극적인 목표가 거래금액 확대라는 점에서 일부 경쟁 심화로 인한

마진 축소보다 중장기 성장성에 주목해야 한다고 판단한다.

아마존 Amazon (AMZN US)

음성 쇼핑의 시대를 열다

Bloomberg 목표주가평균 USD 1,249.23

현재주가 (17/11/09) USD 1,129.13

국가 미국

거래소 NASDAQ

상승여력 10.6%

Bloomberg Rating

매수 보유 매도

92% 6% 2%

EPS 성장률 (17F,%) (18.4)

P/E (17F,x) 282.3

MKT P/E (17F,x) 19.4

배당수익률 (%) 0.0

시가총액 (백만USD) 544,096

시가총액 (조원) 608.5

유동주식수 (백만주) 496.1

52주 최저가 (USD) 710.10

52주 최고가 (USD) 1,135.54

주가상승률(%) 1개월 6개월 12개월

절대주가 13.9 18.5 46.3

상대주가 12.4 10.0 22.7

결산기 (12월) 12/14 12/15 12/16 12/17F 12/18F 12/19F

매출액 (십억USD) 89.0 106.6 136.0 177.4 227.0 270.1

영업이익 (십억USD) 0.2 1.8 4.2 3.0 5.7 13.7

영업이익률 (%) 0.2 1.7 3.1 1.7 2.5 5.1

순이익 (십억USD) (0.2) 0.6 2.4 2.0 4.5 10.9

EPS (USD) (0.53) 1.24 4.90 4.00 8.94 21.33

ROE (%) (2.4) 4.9 14.5 8.6 14.2 24.0

P/E (배) - 545.9 153.0 282.3 126.2 52.9

P/B (배) 13.6 24.3 18.9 21.0 15.5 10.7

주: GAAP

자료: 아마존, Bloomberg, 미래에셋대우 리서치센터

[글로벌 인터넷]

정용제 Yongjei Jeong, CFA 02-3774-1938

[email protected]

70

90

110

130

150

170

190

16.1 16.7 17.1 17.7

AMZN NASDAQ

Page 67: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

Mirae Asset Daewoo Research 67

그림 98. 아마존 알렉사의 ‘보이스 쇼핑’ 가능 하드웨어

자료: 미래에셋대우 리서치센터

그림 99. 아마존 에코 기기 비교

자료: 테크크런치, 미래에셋대우 리서치센터

Page 68: [The Growth Explorer (4)] 음성 인터페이스 시대imgstock.naver.com/upload/research/invest/1510550153688.pdf · 4. 머신러닝 발전으로 음성 인식 플랫폼의 완성도

음성 인터페이스 시대

Voice Revolution

68 Mirae Asset Daewoo Research

투자의견 및 목표주가 변동추이

제시일자 투자의견 목표주가(원) 괴리율(%)

제시일자 투자의견 목표주가(원) 괴리율(%)

평균주가대비 최고(최저)주가대비 평균주가대비 최고(최저)주가대비

NAVER(035420) 2017.04.13 매수 16,500 -7.56 3.03

2017.10.26 매수 1,200,000 - - 2017.04.12 매수 15,000 - -

2017.04.04 매수 1,160,000 -30.14 -17.24 2017.04.12 매수 15,000 -5.33 -5.33

2017.01.02 분석 대상 제외 - - 2017.01.26 매수 15,000 -9.57 0.67

2016.08.30 매수 1,050,000 -22.02 -14.29 2017.01.02 분석 대상 제외 - -

2016.04.28 매수 900,000 -19.54 -9.78 2016.10.31 매수 15,000 -20.91 -16.33

2015.07.30 매수 820,000 -27.59 -16.22 2016.04.05 매수 14,000 -19.75 -13.21

SK텔레콤(017670) 2016.02.01 매수 13,000 -21.44 -14.23

2017.10.27 매수 330,000 - - 2015.07.31 매수 15,000 -26.69 -14.00

2017.07.09 매수 310,000 -15.47 -8.55 로엔(016170)

2017.01.26 매수 290,000 -15.60 -5.34 2017.11.12 매수 126,000 - -

2017.01.02 분석 대상 제외 - - 2017.09.21 매수 110,000 -10.31 1.36

2016.04.29 매수 280,000 -21.10 -16.96 CJ E&M(130960)

2016.02.02 매수 300,000 -29.11 -22.17 2017.11.12 매수 109,000 - -

2015.07.31 매수 350,000 -32.25 -24.86 2017.10.19 매수 102,000 -16.98 -12.35

LG유플러스(032640) 2017.09.05 매수 97,000 -19.12 -13.40

2017.07.10 매수 19,000 - - 2017.01.02 분석 대상 제외 - -

* 괴리율 산정: 수정주가 적용, 목표주가 대상시점은 1년이며 목표주가를 변경하는 경우 해당 조사분석자료의 공표일 전일까지 기간을 대상으로 함

투자의견 분류 및 적용기준

기업 산업

매수 : 향후 12개월 기준 절대수익률 20% 이상의 초과수익 예상 비중확대 : 향후 12개월 기준 업종지수상승률이 시장수익률 대비 높거나 상승

Trading Buy : 향후 12개월 기준 절대수익률 10% 이상의 초과수익 예상 중립 : 향후 12개월 기준 업종지수상승률이 시장수익률 수준

중립 : 향후 12개월 기준 절대수익률 -10~10% 이내의 등락이 예상 비중축소 : 향후 12개월 기준 업종지수상승률이 시장수익률 대비 낮거나 악화

비중축소 : 향후 12개월 절대수익률 -10% 이상의 주가하락이 예상

매수(▲), Trading Buy(■), 중립(●), 비중축소(◆), 주가(─), 목표주가(▬), Not covered(■)

투자의견 비율

매수(매수) Trading Buy(매수) 중립(중립) 비중축소(매도)

74.52% 12.50% 12.98% 0.00%

* 2017년 9월 30일 기준으로 최근 1년간 금융투자상품에 대하여 공표한 최근일 투자등급의 비율

Compliance Notice

- 당사는 자료 작성일 현재 NAVER 발행주식총수의 1% 이상을 보유하고 있습니다.

- 당사는 본 자료를 제3자에게 사전 제공한 사실이 없습니다.

- 본 자료를 작성한 애널리스트는 자료작성일 현재 조사분석 대상법인의 금융투자상품 및 권리를 보유하고 있지 않습니다.

- 본 자료는 외부의 부당한 압력이나 간섭없이 애널리스트의 의견이 정확하게 반영되었음을 확인합니다.

본 조사분석자료는 당사의 리서치센터가 신뢰할 수 있는 자료 및 정보로부터 얻은 것이나, 당사가 그 정확성이나 완전성을 보장할 수 없으므로 투자자 자신의 판단과 책임하에 종목

선택이나 투자시기에 대한 최종 결정을 하시기 바랍니다. 따라서 본 조사분석자료는 어떠한 경우에도 고객의 증권투자 결과에 대한 법적 책임소재의 증빙자료로 사용될 수 없습니다.

본 조사분석자료의 지적재산권은 당사에 있으므로 당사의 허락 없이 무단 복제 및 배포할 수 없습니다.

0

500,000

1,000,000

1,500,000

15.11 16.11 17.11

(원) NAVER

0

100,000

200,000

300,000

400,000

15.11 16.11 17.11

(원) SK텔레콤

0

5,000

10,000

15,000

20,000

15.11 16.11 17.11

(원) LG유플러스

0

50,000

100,000

150,000

15.11 16.11 17.11

(원) 로엔

0

20,000

40,000

60,000

80,000

100,000

120,000

15.11 16.11 17.11

(원) CJ E&M