15
l저자l 김돈정PD / KEIT 지식서비스PDSUMMARY 인공지능에 기반한 음성인식 기술의 발달로 음성인식 가상비서 시장이 급격히 확대되고 다양한 서비스가 증가하고 있다. 인공지능 알고리즘과 빅데이터에 기반하여 음성인식(ASR), 음성이해(NLU), 음성합성(TTS) 기술의 발달로 인간의 소통 수준에 도달하고 있다. 음성인식 가상비서의 대표제품인 스마트스피커는 아마존을 필두로 2018누적 1억대가 보급되어 미국에서는 케즘(Chasm)을 넘어 일상화의 단계에 있다. 서비스는 음성 UX장점을 기반으로 Q&A, 음악, 날씨, 스마트홈 서비스로 활성화되어 스마트폰의 사용량에 영향을 주기 시작하였다. 시사점 정책제안 스마트스피커의 형태에서 디스플레이 형태, 가전제품 내재화로 진화하고, B2C 중심 서비스에서 호텔, 아파트, 회사 B2B로의 다양한 형태가 시도되고 있다. 개인정보 보호 측면, 인간과 기계의 협업 관점, 1인가구/고령화 인구구조 변화에 따른 고려가 필요하다. 타산업과의 융합을 통한 부가가치 제고라는 지식서비스R&D 관점에서 음성인식 가상비서의 산업현장 도입과 새로운 BM 창출의 기술로의 활용이 필요하다. 음성인식 가상비서 기술 동향 전망

SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

l저자l 김돈정PD / KEIT 지식서비스PD실

SUMMARY

인공지능에 기반한 음성인식 기술의 발달로 음성인식 가상비서 시장이 급격히 확대되고 다양한 서비스가 증가하고 있다.

인공지능 알고리즘과 빅데이터에 기반하여 음성인식(ASR), 음성이해(NLU), 음성합성(TTS) 기술의 발달로 인간의 소통 수준에 도달하고 있다.

음성인식 가상비서의 대표제품인 스마트스피커는 아마존을 필두로 2018년 누적 1억대가 보급되어 미국에서는 케즘(Chasm)을 넘어 일상화의 단계에 있다.

서비스는 음성 UX의 장점을 기반으로 Q&A, 음악, 날씨, 스마트홈 서비스로 활성화되어 스마트폰의 사용량에 영향을 주기 시작하였다.

시사점 및 정책제안

스마트스피커의 형태에서 디스플레이 형태, 가전제품 내재화로 진화하고, B2C 중심 서비스에서 호텔, 아파트, 회사 등 B2B로의 다양한 형태가 시도되고 있다.

개인정보 보호 측면, 인간과 기계의 협업 관점, 1인가구/고령화 등 인구구조 변화에 따른 고려가 필요하다.

타산업과의 융합을 통한 부가가치 제고라는 지식서비스R&D 관점에서 음성인식 가상비서의 산업현장 도입과 새로운 BM 창출의 기술로의 활용이 필요하다.

음성인식 가상비서 기술 동향 및 전망

Page 2: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

16 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

1. Intro

음성인식 가상비서의 등장

매년 벽두에 열리는 CES(Consumer Electronics Show)는 50년 전통의 세계최대 가전전시회이다. 매해 휘황찬란한 디스플레이의 향연이 펼쳐지지만 2018년부터 참가한 두 회사로부터 변화가 시작되고 있다. 바로 아마존(Amazon)과 구글(Google)이다.

- 아마존의 ‘알렉사(Alexa)’와 구글의 ‘HeyGoogle’로 알려진 음성인식 가상비서(Voice Assistant) 플랫폼은 가전을 비롯한 IoT 디바이스들을 차지하기 위해 경쟁하고 있고, 금년 CES에 전시된 가전제품에 본격 내재화되기 시작하였다.

| 그림 1. CES 아마존 및 구글 전시장 |

인공지능 가상비서는 4차산업혁명의 대표기술 중 하나로 소비자와 만나는 접점이 되고 있다.

- 인공지능 기술의 등장으로 모라벡의 역설(Moravec’s Paradox)은 점차 무너지고 있다. 대표적으로 궁금한 것을 말로 질문하면 바로 알려주고 쇼핑, 예매까지 가능한 음성인식 가상비서가 있다.

※ Moravec’s Paradox: 인간에게 쉬운 것(손가락으로 물건집기, 의사소통 등)은 컴퓨터에게 어렵고, 인간에게 어려운 것(복잡한

수학 계산)은 컴퓨터에게 쉽다는 역설

- 음성인식 가상비서의 한 형태인 스마트스피커(Smart Speaker)는 음성인식 기술의 획기적인 향상과 글로벌 거대 혁신기업들이 뛰어들면서 영역을 넓혀가고 있다. 스마트스피커를 중심으로 [그림 2]와 같이 다양한 서비스 및 디바이스와 연결되고 있다.

- 인공지능 가상비서는 내 친구에서, 스마트홈 연계, B2B 모델로 진화하고 있고, 스피커 형태에서 디스플레이 (display)형 제품으로 확장되고 있다.

Page 3: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

17Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

| 그림 2. 스마트스피커 연계 서비스 및 연동 디바이스 [1] |

2. 음성인식 가상비서 기술 동향

ASR, NLU, TTS, 음성인식 기술의 발달

알파고(AlphaGo)의 등장은 인공지능이 우리에게 다가오는 신호탄이었다. 이후 인공지능은 다양한 모습으로 진화하고 있다.

- 첫째, 인간의 두뇌를 뛰어넘고자 하는 지능화(intelligence)이다. IBM의 딥블루(Deep Blue)가 체스 챔피언을 꺽으며 가능성을 보여주었고, 알파고를 통해 빅데이터(Big Data)와 머신러닝(Machine Learning) 기술로 무장하여 특정 영역에서는 인간의 지능을 뛰어넘을 수 있음을 보여주고 있다.

※ 2017년 7월 칭화대와 아이플라이텍(iFlytec)에서 개발한 의료 AI 샤오이는 중국 국가의사시험을 가볍게 통과하였고, 2019년 1월

구글 딥마인드는 스타크래프트 게임에서 인간과 겨루어 이겼다.

- 둘째, 인공지능이 제조산업에 도입되는 영역으로 자율주행(Self Driving) 분야이다. 미국방성 DARPA( Defense Advanced Research Project Agency)Challenge에서 시도되고, 구글의 도전을 기화로 대부분의 자동차 회사가 뛰어들기 시작하였다.

- 셋째, 음성인식 가상비서(Voice Assistant)는 스마트폰의 서비스 중 하나인 시리(Siri)로 시작되었다. 큰 반응을 보이지 않다가, 스마트스피커를 통해 구현된 아마존의 알렉사(Alexa)에서부터 폭팔적으로 성장하고 있다.

Page 4: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

18 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

| 그림 3. 인공지능 서비스 주요 유형 |

<History> 음성인식 가상비서는 음성인식 기술의 발달로 등장하였다.

- 1950년대부터 음성인식 기술은 꾸준히 연구되었으나, 음의 높낮이, 말하는 속도, 문장에 따른 발성의 차이, 사투리 등을 쉽게 구별하지 못하였다.

※ 1990년 Yahoo가 10년간 집중적으로 투자하여 인식율을 80% 수준까지 높였으나, 2010년까지도 그 수준을 넘지 못하였다.

- 2010년 중반에 들어서 구글을 중심으로 1,000억 개에 달하는 대규모 음성 데이터 축적과 Deep Learning 알고리즘(word2vec)이 접목되면서 비약적으로 개선되었다[2]. 2017년 인간의 소통 수준인 95%에 도달하였다 [그림 4].

- 중국 바이두의 음성인식 기술 ‘딥스피치(DeepSppech)’는 인식율이 97%에 달하며, 우리나라도 한국어 음성인식율도 상당한 수준에 도달해 있다[3].

지난 20여 년간 인간과 기계와의 소통 방식은 키보드, 마우스, 터치를 통한 입력과 화면을 통한 출력이었다.

- GUI(Graphic User Interface) 방식은 인간과 로봇의 소통에는 큰 도움이 되지 못하였다. 음성인식 기술의 발달로 인간과 로봇과의 소통(HRI, Human Robot Interface)도 가능해지고 있다.

| 그림 4. 음성인식율 추이 [4] |

Page 5: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

19Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

<핵심기술> 음성인식 가상비서를 제공하기 위한 핵심 기술로는 음성인식(ASR), 음성이해(NLU), 음성합성(TTS)이 있다.

- 첫째, ASR(Automatic Speech Recognition)은 발화자의 명령어를 컴퓨터가 이해하는 언어(Text)로 자동 변화하는 기술로 인공신경망 엔진을 활용하여 단어와 문장을 학습한다.

- 둘째, NLU(Natural Language Understanding)는 주어진 Text를 어떤 의미 인지를 파악하는 기술이다. “기분 좋은 음악 들려줘” 하면 ‘기분 좋은 노래’로 지정되어있는 음악을 찾아 틀어달라는 의미로 분석하는 것이다. 발화자의 의도를 파악하기 위하여 다양한 유사패턴을 학습한다.

※ 최근 Deep Learning 기술이 본격적용되면서, 이해능력이 급속도록 향상되고 있다. 2018년 10월 구글의 BERT모델은 인간의

수준을 능가하는 성능을 보여주었다[3].

- 셋째, TTS(Text to Speech)는 Text 문장을 음성으로 변환하는 기술이다. 사람이 말하듯이 속도나 높낮이 조절하는 것이 기술력이다. 각각의 기술에 서비스를 구현키 위한 다양한 데이터가 유기적으로 결합되어 음성인식 가상비서 서비스가 가능해진다.

| 그림 5. 음성인식 가상비서 구조도 |

음성인식 가상비서가 서비스가 대표적으로 구현된 스마트스피커는 차세대 기술로 주목받고 있다.

- 미국 소비자 기술 협회(Consumer Technology Association)에서 2019년 큰 성장이 예상되는 카테고리로 스마트스피커를 스마트 워치, 스마트홈 디바이스와 함께 제시하였다[그림 6].

Page 6: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

20 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

| 그림 6. How Big are the “Next Big Things” in Tech [5] |

3. 음성인식 가상비서 시장 현황

스마트스피커, 2018년 누적 1억대 보급

시장에서는 스피커 형태의 음성인식 가상비서 서비스가 자율주행, 자동번역과 더불어 인공지능의 대표적인 상품으로 등장하고 있다.

※ Big Data Zone(2017) 자료에 의하면 2020년이 되면 음성검색이 전체 검색의 30% 수준까지 도달할 것으로 예측할 정도로 발전

가능성을 높게 보고 있다.

- voicebot(2019)에 의하면 [그림 7]과 같이 음성서비스는 스마트스피커에서 가장 많이 사용하는 것으로 조사되었다. “공기청정기 켜줘”, “What’s the weather in New York”와 같이 명령어를 말하자마자 공기청정기가 가동되고, 뉴욕날씨가 흐린지 온도와 습도가 어떤지를 설명해준다.

| 그림 7. 음성서비스 사용경험 [5] |

Page 7: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

21Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

<판매대수 및 매출> 시장조사업체 Canalys에 따르면 전세계 스마트스피커 보급은 2018년까지 누적 1억대 규모가 예상되고 2022년에는 3억 대가 넘을 것으로 예측하였다[7].

- 미국의 경우 2019년 66.4백만 명이 한대 이상 보유하게 되어 인구대비 점유율 26.2%로 케즘(Chasm)을 넘어 일상화의 단계에 도달한다.

- 우리나라의 경우 2018년 말까지 300만대 가까이 팔린 것으로 예측되나 그 속도는 미국 등에 비해 상대적으로 느린편이다.

- 스마트스피커 디바이스 매출도 2022년 8.7조 규모로 지속적 성장이 예측된다[8].

| 그림 8. 스마트스피커 판매 추이 [7], 매출 추이 [8] |

<주요제품> 주요 거대 기술기업은 모두 스마트스피커를 내놓고 있다.

※ MIT(2018)에서 발표한 2017 혁신기업 중 Top 10에는 아마존, 구글, 커다쉰페이(중국)과 같은 AI기업이 대부분 포진하고 있다.

- 스마트스피커 선도 회사인 아마존은 2014년말 에코(Echo) 스피커를 최초 출시한 이래, 저가형 제품인 Echo dot, 카메라로 본인에 적합한 의상을 골라주는 Echo Look, 음성과 디스플레이가 결합된 서비스를 제공하는 Echo Show 등 새로운 디바이스를 잇따라 선보이고 있다. 커머스(Commerce) 사업에 이은 새로운 성장동력으로 각광 받고 있다.

- 구글의 경우 AI스타트업인 Api.ai사 인수를 기반으로 2016년 10월 구글홈(Google Home) 스피커를 출시하였고,

- 애플은 2018년 시리가 탑재된 홈파드(HomePod)를 출시하였다.

- 중국도 발 빠르게 움직이고 있다. 중국어 음성인식 회사인 iFlyTec사가 딩동 스마트스피커를 2016년 말 출시하였고 화웨이(Huawei)에서도 제품을 선보였다.

국내에서도 주요 통신사 및 인터넷 기업을 중심으로 스마트스피커를 출시하였다.

- 2016년 9월 SK텔레콤이 NUGU를 시작으로 btv NUGU 를 내놓았고,

- 2017년 KT는 스피커와 셋톱박스(Set-Top Box)를 결합하여 음성과 TV 디스플레이를 동시에 보여주는 기가지니를 출시하였다.

Page 8: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

22 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

- 네이버는 자체 AI플랫폼인 클로버(Clover) 기반의 웨이브(WAVE), 캐릭터를 반영한 프렌즈를, 카카오는 카카오톡과 연계된 카카오 미니를 출시하였다.

- 삼성전자는 음성비서 빅스비(Bixby)를 탑재한 스피커를 2018년에 출시하였다.

| 그림 9. 주요 스마트스피커 현황 [1] |

향후 음성인식 기술의 안정화, 다양한 서비스의 증가와 함께, 디바이스의 형태도 디스플레이 탑재 형태, 이어셋 모양, 로봇의 모습으로 확산되고 있다.

4. 음성인식 가상비서 서비스

음성 UX의 장점을 기반으로 Q&A, 음악, 날씨, 스마트홈 서비스 활성화

스마트스피커는 스마트폰과 경쟁하기 시작하고 있다.

- 컨설팅사 에센츄어(Accenture, 2018)에 따르면, 스마트스피커 소유자의 2/3가 스마트폰 사용량이 줄었다. 음악뿐만 아니라 정보검색, 온라인구매에서도 사용량이 감소하였다[9].

음성으로 명령하면 다양한 장점들이 발견된다. 스마트스피커의 사례를 보면,

- 태어날 때부터 몸에 밴 자연스러운 방식이라 학습이 쉽다. “이효리의 남편이 누구야?”, “우리팀 프로야구 이겼어?” 와 같이 말하는 대로 서비스를 기획하고 실행할 수 있다.

- 원하는 명령을 복잡한 검색 단계를 거치지 않고 바로 실행할 수 있다. 음악사이트에서 BTS의 원하는 노래를 찾기 위해서는 여러 단계를 거쳐야 하지만 스마트스피커에서는 “BTS의 아이돌 들려줘” 하면 된다.

Page 9: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

23Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

- 음악을 크게 듣고 싶을 때 손으로 볼륨버튼을 눌러야 했으나, 앉은 자리에서 “볼륨 올려줘” 하면 된다.

- 손과 눈이 자유로워져서 데이터를 쉽게 찾아볼 수 있다. 즉, 요리할 때 파스타 만드는 법을 물어보거나, 운전할 때 고속도로가 막히고 있는지 물어볼 수가 있게 된다.

※ AI 전문가인 앤드류 응(Andrew Ng)박사에 따르면 음성명령이 Text입력 보다 2.8배 이상 빠르다고 하였다.

스마트스피커는 음악을 비롯하여 초기 스마트폰의 어플리케이션 시장과 같이 다양한 서비스로 확장하고 있다.

- 아마존이 가장 빨리 플랫폼化하고 있다. 스킬(skills)이라고 불리우는 서비스가 2016년 130개에서 2017년 2만개, 2018년은 이미 5만개 이상이 확보되어 급격히 확산되고 있다[10]. 국내 업체는 2018년말 100여개의 서비스에 불과한 상태이다.

| 그림 10. Amazon Alexa skills [10] |

<주요 서비스> 스마트스피커의 주요 서비스로는 단순질문, 뉴스, 날씨, 맛집 안내 등 다양하게 제공된다.

- 킬러서비스인 음악의 경우 웹이나 앱의 GUI 방식에서는 첫 화면의 최신/인기 음악이 가장 빈도가 높으나 화면이 없는 스피커에서는 메타태그(meta tag)에 의해 만들어진 “신나는 노래 들려줘”와 같은 추천서비스가 자주 이용된다.

- 가정 내 가전/IoT 기기와 연계를 시도해왔던 스마트홈 플랫폼이 음성인식 기반의 스마트스피커와 결합하면서 활용도와 사용가치를 높여나가고 있다. 침대 속에서 “불 꺼줘”란 말 한마디로 간단히 전등을 끄는 경험은 고객의 그동안 보이지 않던 불편함을 해소하게 되었다.

※ 이로인해 스마트전등을 만들어 온 필립스휴(Philips HUE)의 매출이 더불어 증가하였다.

Page 10: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

24 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

| 그림 11. Smart Speaker Use Case Frequency [11] |

<서비스의 방향> 새로운 형태의 서비스도 속속 등장하고 있다.

- 여러대의 스피커를 연결하는 멀티룸 오디오(multi-room audio) 기능이 제공되고, 라스베가스 윈(Wyn)호텔과 같이 객실에 스마트스피커가 설치되어 음성으로 객실환경을 제어하고 호텔서비스를 부른다. 부가하여 호텔은 고객 사용패턴을 수집할 수 있게 되었다.

- 국내에서는 AI아파트를 표방하며 빌트인 형태의 스마트스피커를 시공에 반영하고 있다. 조명, 가스제어, 냉난방 기기들을 조절하고 사용패턴을 수집하여 빅데이터(Big Data)화 하는 방안도 시도되고 있다.

- AI 플랫폼간 협력 및 연동도 활성화될 예정이다. 아마존 알렉사(Alexa)의 이용자가 “Alexa, Open Cortana”라고 말하면 MS의 AI플랫폼 코타나(Cortana)를 이용할 수 있고, 반대로 윈도우10 코타나 사용자가 “Cortana, Open Alexa”라고 하면 알렉사를 호출할 수 있다.

- 과거 PC에서 MS OS와 Mac OS가 스마트폰에서 안드로이드와 iOS가 상호 호환되지 못했지만, 음성UX로의 변화는 기술적 문턱을 낮추어 플랫폼 간의 개방과 협력을 촉진시키고 있다. 앞으로 상호 취약점을 보완하고 고객의 사용성은 증가될 것으로 예상된다.

Page 11: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

25Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

5. 음성인식 가상비서 이슈와 과제

프라이버시 vs. 나의 친구

인공지능 가상비서는 편리한 UX, 급격히 성장하는 마켓, 새로운 서비스의 증가와 동시에 고려해야할 요소도 다수 있다.

※ 테슬라의 일론 머스크(Elin Musk)와 딥마인드의 하사비스(Hassabis)는 AI 기술의 위험성을 경고하고 치명적인 AI무기를

개발하지 않겠다고 서약서에 서명했다. 반면, 페이스북의 마크 저커버그(Mark Zuckerberg)는 “AI에 반대하거나 종말론적

시나리오를 만드는 사람들을 이해할 수 없다. 너무 부정적이고 무책임하다”고 상반되게 주장하였다.

- 낙관론자가 비행기를 만들었고 비관론자가 낙하산을 만들었듯이 새로운 기술의 도입은 예상되는 문제와 해결방안 모두를 봐야 한다.

첫째, 프라이버시(privacy)이다.

- 머신러닝 기술이 수집하는 대량의 데이터로 인해 사생활 침해 가능성이 높아진다. 스마트스피커의 상시 대기 상태로 인해 상시 침해를 받을 수 있는 프라이버시 로깅(privacy logging) 환경 생성 및 이용자의 사적대화나 검색 내용을 도용하는 음성 무단 점거(voice squatting) 가능성이 높아질 수 있다[12].

- 스마트스피커의 특성상 주변인이 같이 들을 수 있어 전화통화 내용, 구매정보, 계좌정보 등 개인정보 노출과 상대적으로 보안성이 약한 IoT 기기들의 해킹도 고려하여야 한다.

둘째, 플랫폼의 개방(Open Platform)이다.

- 인공지능 플랫폼의 등장으로 특정 기업이 독점하거나 일자리를 빼앗는 것이 아니라 공유와 협력 시대에 맞추어 플랫폼간의 협력이 시도되어야 한다.

※ 구글 등 글로벌 ICT기업은 많은 투자를 해온 인공지능 플랫폼을 무료로 공개하기 시작하였다. 소스코드, API, 테스트 환경 등 개발

플랫폼을 공개하고 있고, 이 툴(tool)을 스타트업들이 적극 활용하게 하여 생태계를 구축하고 있다.

- 인공지능 기반 기술 및 서비스 플랫폼은 대규모 자본이 투하되므로 자본력이 있는 ICT기업이나 공공이 주로 담당하고, 다양한 환경에서 새로운 기술을 발굴하고 도메인 영역의 서비스 구현은 콘텐츠 보유 기업과 스타트업의 역할이 필요하다.

- 정부는 인공지능 생태계가 형성될 수 있도록 공공에서 데이터의 공유와 표준 수립, 지원정책 제시가 필요하다.

셋째, 인구구조의 변화에 대한 대응이다.

- 통계청에 따르면 2017년 전체 가구 중 1인 가구의 비중이 28.6%에 달한다. 4,50대 중년 1인 가구가 증가하고 있다.

※ 중년 1인 가구의 증가는 이혼이나 별거, 자녀 유학, 기타 경제적 이유로 가족과 떨어져 생활하는 비자발적 1인 가구가 많아졌기

때문으로 풀이된다.

Page 12: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

26 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

- 한편 통계청에 따르면 65세 이상의 고령인구는 2017년 14%로 이미 고령사회에 진입하였다. 인구 비중이 20%가 넘어가는 초고령사회는 2026년이면 도달한다.

- 앞으로 1인 가구 증가와 고령화사회 진입에 따라 관련 산업도 변화가 예상된다. 음성인식 가상비서와 연계된 스피커, 홈 기기, 홈 로봇이 하나의 역할을 담당하게 될 것이다.

| 그림 12. 65세 이상 인구 추이 (통계청, 2018) |

혼자 있는 시간이 많은 노인과 1인 가구는 소통이 부족하거나, 공감을 받기가 어렵다.

- 누구와도 연결됨을 느끼지 못한다면 우울증과 치매로 연결될 수 있다. 독신남녀가 퇴근했을 때 공감해주고 반갑게 맞아주는 에이전트가 있다면 혼자가 아니라는 안도감과 위안을 얻을 것이다.

- 가족이나 사회가 도와주지 못한다면 이를 해결할 에이전트(Agent)의 개발을 고려하여야 한다.

- 한편 인터넷, SNS에 남겨둔 개인의 다양한 자료가 빅데이터化하여 인공지능 기술로 재탄생 된다면 사후에도 나의 분신으로 교감이 가능한 아바타(Avatar)가 등장할 수 있다.

※ 과학자였던 남편은 자신의 죽음을 직감한다. 혼자 남겨질 치매에 걸린 부인을 위해 자신의 모든 기억을 입력시킨 아바타를 만든다.

이 아바타는 남편의 분신으로서 부인 옆에서 흐려져 가는 기억을 되살리기 위해 끊임없이 말을 건다. 부인은 어느덧 아바타를

남편과 동일시하게 되며, 결국 사랑에 빠진다. 영국에서 상영된 ‘스플리킨(Spillikin)’이란 연극으로 국내에도 도입 예정이다.

| 그림 13. 연극 ‘Spillikin’ |

Page 13: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

27Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

6. 음성인식 가상비서와 지식서비스

지식서비스와 4차산업혁명 기술과의 연계는 필수

<지식서비스 R&D> 지식서비스는 지식을 집약적으로 생산·가공·활용하고, 타 산업과의 융합을 통해 높은 부가가치를 창출하는 서비스산업이다.

- 대규모 생산을 통한 비용절감보다 소비자의 니즈를 빠르게 반영하는 것이 부가가치를 창출하는데 더 중요해지면서 제품기술경쟁력뿐만 아니라 새로운 서비스를 개발하고 구현하는 역량이 중요해지고 있다.

- 새로운 서비스와 비즈니스 모델을 창출하고 이를 구현하기 위한 기술을 개발하기 위해 서비스산업 분야에도 제조업 분야만큼 연구개발(R&D) 투자가 필요하다[13].

지식서비스산업은 4차산업혁명 기술과의 연계가 기본이 되고 있다.

※ 존 체임버스 전 시스코 회장은 “모든 기업은 기술 기업이 되어야 하며, 모든 제품은 기술 제품이 되어야 한다”라고 하였다.

- 대표적으로 Apple, Google, Amazon 등을 중심으로 한 기술(Technology)기반 산업은 모든 산업을 집어삼키고 있다.

※ 기술기업인 Apple 한 회사의 브랜드 가치가 자동차산업 전체의 4/5에 달할 정도이다.

| 그림 14. Best Global Brand 2018 [14] |

대표적인 4차산업혁명 기술 중 하나인 음성인식 가상비서 기술은 이제 먼 세상의 얘기가 아니다. 우리 가정의 거실과 부엌 그리고 침실의 얘기가 되었다.

- 국가 AI R&D 전략에서 국방, 의료, 안전 등 공공 분야를 대상으로 대형 AI프로젝트를 추진하고, 머신러닝, 시각·언어지능 등 독자적인 AI 기술력 확보를 목표[15]로 하고 있어 향후 연계방안이 필요하다.

Page 14: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

28 한국산업기술평가관리원

PD ISSUE REPORT APRIL 2019 VOL 19-4KEIT PD Issue Report

- 한편, 음성인식 가상비서의 보급 수준은 미국 등 선도국가에 비하면 아직 뒤처져 있다[그림 15].

| 그림 15. voice assistant technology adoption by country, Best Conversion Rates of Voice Assistant Trial to Monthly Use by Auto Brand [11] |

음성인식 가상비서 영역에서 선도국가를 따라잡기 위해서는 인간과 기계가 협업할 수 있는 산업현장에 적극적인 도입 시도가 필요하다.

※ 하버드 비즈니스 리뷰(2018)에 따르면 인간과 기계는 서로 협력할 때 각자 일하는 것보다 더 큰 성과 향상을 이룬다[16].

- 다양한 제조 공정, 업무환경에 강화학습 기반의 인공지능이 앞으로 빠르게 적용될 것으로 전망되며, 현실 세계의 인간과 같이 학습하는 기계가 인간과 협력하는 것이 가능할 것이다.

ICT에 대한 이해도가 낮고 영세한 사업장의 경우 제조서비스 융합 측면에서 UX가 단순한 음성인식 가상비서를 통한 협업을 시도해야 한다.

- 제조현장에서 말 한마디로 기계를 멈추게 하여 위험한 상황에서 벗어나거나, 다국적 작업자 간의 소통 도구가 되고, 회의를 소집하고 기록하는 업무효율 향상을 위한 도구로 활용이 가능하다.

음성인식 가상비서를 이용하여 지식서비스의 새로운 BM 창출도 시도해야 한다.

- 음성 명령은 별도로 배울 필요가 없다는 장점 하나로 새로운 기술에 뒤쳐져 있던 다양한 산업에 새로운 활력을 끌어올릴 것이다.

Page 15: SUMMARY - BioIN › InnoDS › data › upload › tech › 8a11f0b8e04c43df83… · ISSUE 1 음성인식가상비서기술동향및전#Ä | 그림 2. 스마트스피커 연계 서비스

29Korea Evaluation Institute of Industrial Technology

ISSUE 1 음성인식 가상비서 기술 동향 및 전망

[참고문헌]

1. “핫트렌드 2018, 빅도미노”, 김경훈·트렌드연구소빅퓨처(2018), 로크미디어

2. “최근 인공지능 개발 트렌드와 미래의 진화 방향”, 이승훈(2017, 10), LG경제연구원

3. “카카오 AI, 한국어 독해 능력 평가서 인간보다 높은 점수로 1위”, 전자신문(2019. 2. 1)

4. “Internet trends 2018”, Mary Meeker, 2018 May

5. “How Big Are the “Next Big Things” in Tech?”, Felix Richter, 2019 Jan, Statista

6. “Voicebot Voice Consumer Adoption Report 2018”, Voicebot, 2019 Feb, voicebot.ai

7. “Smart speaker installed base to reach 100m to 2018”, Canalys Newsroom, 2018

8. “Technology, Media & Telecommunications Smart Speakers Take Off”, Mike Paxton, 2018 Jun, S&P

9. “Smart speakers are eating mobile: 66% of owners use smartphones less”, Koetisier J., 2018 Jan, forbes.com

10. “Amazon rolls out new ways to monetize Alexa’s skills”, Jessica Smith, 2018 May, Business Insider

11. “Smart speaker consumer adoption report 2018”, Voicebot, 2019 Jan, voicebot.ai

12. “인공지능(AI)과 프라이버시의 역설: AI음성비서를 중심으로”, 심흥진(2018, 12), KISDI

13. “서비스산업 비즈니스모델 혁신 경쟁력 분석 및 시사점”, 김승민·고대영(2018, 8), KIET 산업경제

14. “Interbrand Best Global Brands 2018”, Interbrand, 2018 Oct

15. “I-Korea 4.0 실현을 위한 인공지능(AI) R&D 전략”, 과학기술정보통신부(2018)

16. “협업지성, 인간과 AI가 힘을 합치다”, 폴 R. 도허티(Paul R. Daugherty), H. 제임스 윌슨(H. James Wilson) (2018, July-August), Harvard Business Review Korea