51
智慧語音助理趨勢與開發介紹 Lanma Chiu @ ITHome

智慧語音助理趨勢與開發介紹™º慧...Google Home 功能 播放音樂 控制智慧家庭硬體 播放與修改行事曆 送簡訊 查詢最簡單回答 翻譯 導航 顯示至螢幕

  • Upload
    others

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

智慧語音助理趨勢與開發介紹

Lanma Chiu @ ITHome

智慧語音助理趨勢與開發介紹:Lanma Chiu 邱鴻鈞

Lanma’s Facebook: https://fb.me/lanma0307智慧語音助理粉絲頁: https://fb.me/smart.voice.assistant

● 3D/VR● 自動化系統

● Android● iOS● Server● 語音助理

● 機器人

Zenbo

Amazon Echo Dot

Google Home

Raspberry Pi

Line BotFB Bot

出場Demo

前身

語音助理前身:聊天機器人

ELIZA 1966 @ MIT人工智慧實驗室

以語音作為系統功能的捷徑

廣為人知的”語音“助理:Siri / Cortana / Google Assistant

蘋果Siri Google Assistant微軟Cortana

AI越來越強了以後

聊天機器人進化:微軟小冰,微軟小冰讀心術(微信)

http://webapps.msxiaobing.com/MindReaderWeChat搜尋:小冰

智慧語音助理綜觀

使用者 語音助理 語音轉文字

功能模組

語意分析

麥克風 喇叭

顯示器

智慧家庭硬體

文字轉語音

燈泡 音響 開關

感測器

Cam 溫濕 空品

泛用AI助理

回應媒體

聲音 影像 文字

其他網路資源

單獨的硬體語音助理

華碩ASUS

Zenbo

Zenbo特點

● 跌倒求救

● 遠端遙控

● 尋人拍照

● 圖形化編程

● 前往指定地點(建立室內地圖)● 故事的動態與聲光效果

● 自由安裝App

Zenbo硬體

● 可定向麥克風(呼叫他時會面對你)● 15W喇叭(蠻大聲)● Wifi/藍芽

● 輪子馬達動力強,電池5-8小時

● 3D相機

● 10吋觸控螢幕

● USB3.0外接孔

● Android開放系統

Zenbo四套開發工具

原生SDK 故事編輯器 圖形化編程 對話編輯器

Zenbo SDK : 原生

動作

語音

Zenbo SDK

表情

視覺

Zenbo SDK : DDE (對話編輯器)

Zenbo Story Editor (故事編輯器)

Zenbo SDK : App Builder (圖形化編程) (Demo)

Zenbo Demo

● 鸚鵡講話

● 猜猜我幾歲

● 和朋友說話

Google

Google Home

Google Home 功能

● 播放音樂

● 控制智慧家庭硬體

● 播放與修改行事曆

● 送簡訊

● 查詢最簡單回答

● 翻譯

● 導航

● 顯示至螢幕

2017即將新增

● 定時通知(新)● 打電話(新)● 螢幕顯示搜尋結果(新)● 支援並可辨認多使用者(新)● 自訂捷徑

Google Home 體驗

● 一般問題

○ My Briefing● 第三方Google Action○ 免啟動,通過審核即用

○ 目前沒有列表,只能滑動

觀看

Google Home App 畫面

Google Home 硬體

● 兩個高感度麥克風

● 喇叭

● 藍芽○ 本身可當藍芽喇叭(新)

軟體技術

● 語音轉文字 (STT)○ 英文、(其他New)法文、德文、葡萄牙文、日文、義大利文、西班牙文、韓文

● 文字轉語音(TTS)○ 預設女聲,但有男女各二

● 第三方可擴充項目○ Google Action○ Google Assistant SDK

Action on Google (第三方外掛)

● Actions SDK○ 自行控制回應行為

● Api.ai○ 語意分析(帶機器學習)○ 設定回應方式

○ 可設定呼叫外部服務取

得回應(ex:天氣)

Google Home IFTTT

Google Assistant SDK (ex:使用樹莓派)

● Raspberry Pi 3● USB麥克風

● 喇叭

● PS:可用USB音效卡

Google Assistant SDK 範例

Google Home 結論

● 智慧Wifi音箱,可與Chomecast連線顯示

● 用說的就會通,主功能是要求-回應

● 透過Google Action (Assistant App)增加功能

● 透過Google Assistant Kit滲透至其他裝置

● 可以自己DIY

Amazon

Amazon Echo 原始家族

Echo Tap Dot

Amazon Dash Wand (二代含Alexa)

Amazon Echo 網頁模擬器 (Demo)

https://echosim.io/

Amazon Echo / Tap / Dot (Demo)

Echo Tap Dot

● 總統

● 距離

● Magic Door

Echo硬體

● 七個矩陣麥克風

● 喇叭○ Echo Dot可用Lineout外接喇叭

● 藍芽○ 可改連外部藍芽喇叭輸出

○ 本身可當藍芽喇叭

Amazno Echo Look$199

Amazon Echo Show$229 ~ 180

軟體技術

● Speech to text (STT)○ 自家訓練模型,目前支援英文,德文

● Text to speech(TTS)○ 語音音質溫暖

○ 目前只有一組聲音

● 第三方可擴充項目○ Alexa Skill Kit (ASK)○ Alexa Voice Service (AVS)

Alexa Skill Kit

● 語音版本的App

● 語音問答

● 互動語音遊戲

● 音樂與音效

● 有聲書

● 線上電台

● 預訂(訂票,訂餐,叫車)● 智慧家庭硬體控制

● 品牌形象 alexa.amazon.com

Alexa Skill Gallery

https://www.amazon.com/b?ie=UTF8&node=13727921011

ASK開發者網站

https://developer.amazon.com/alexa-skills-kit

Alexa Skill 官方三類型

● 一般自訂

使用者查詢之回應或互動

● 智慧家庭

控制燈光或控制溫度

● 最新簡報

使用者整合資訊與新聞

限制與轉機

● Alexa skill不允許外部通知驅動

● 5/16宣布將實驗”Skill選用啟動通知”● 實驗完成才會發布SDK

使用者 語音助理

外部事件

自訂通知

Alexa Voice Service

https://developer.amazon.com/alexa-voice-service

Alexa無所不在

Mac

GE智慧檯燈 Samsung吸塵器 LG冰箱

Alexa@樹莓派

● Raspberry Pi 3● USB麥克風

● 喇叭

● PS:可用USB音效卡

Alexa IFTTT (Line Demo)

Amazon Echo (Alexa) 結論

● 智慧Wifi/藍芽音箱,也有相機版與觸控顯示版

● 用說的就會通,主功能是要求-回應

● 透過Alexa Skill Kit增加功能

● 透過Alexa Voice Service Kit滲透至所有裝置

● 可以自己DIY

結論

● Google Home / Amazon Echo○ 指令/回應型

○ 內含大廠人工智慧助理

○ 只能取辨識好的文字

○ 雲端新增功能

○ 大廠爭奪戰,尚無第三方商業

模式

● Zenbo○ 指令/回應

○ 外部驅動彈性更大

○ 能取得聲音與影像

○ 雲端/App新增功能

謝謝