Programmable Smart Voice Assistant技術簡介
ITRI語音助理,透過語音轉文字及語意分析技術,學習理解使用者意圖並處理所有生活支援,包括天氣、音樂播放、搜尋、購物清單、提醒事項、時間與鬧鐘,當使用者說「我想聽派對動物」即可理解並播放五月天的派對動物歌曲。
透過後端TOMATO平台串連整合,更擴大連結IM、Email、智慧燈泡/插座、智慧家電等多種第三方資訊服務與IoT產品。如串連Line送出語音訊息「兒子,週六家庭聚餐」;串連IoT產品,語音指令「我出門了」自動關閉A ,B兩款品牌家電,並啟動IPCam保全模式。
技術特色
ITRI語音助理具備高抗噪的語音喚醒、高擬真的語音播放、中台外語混合辨識技術,同時提供主要生活領域的智慧語意理解能力,及跨品牌、跨服務的異質整合能力,技術完整度高並可針對不同使用需求快速客製化。
技術規格
- 語音喚醒詞偵測技術,自動偵測特定之喚醒指令, 啟動後續語音辨識
- 高音質中文文字轉語音技術,提供自然流暢且具韻律強化的中英夾雜合成語音
- 中文夾雜外來語語音辨識技術,提供可新增外來語詞彙(包括台語、英語、日語...等)之語音辨識系統
- 支援自行定義語音命令,提供使用者設定”芝麻開門”打開智慧門鎖
- 智慧家庭/智慧生活領域之深度語意理解技術,提供通用文法與自訂指令混合理解
- 異質服務整合平台支援OAuth2.0標準介接, 提供When-these-Do-those複合規則執行引擎
應用範圍:
可用於智慧家庭、智慧飯店、智慧商店等,協助用戶高效管理日常行程、訊息傳遞,兼具娛樂活動之智能助理。
連絡窗口:
徐佩如/ IoT暨IC技術與應用推廣部(C300)
電話:03-5918030
Email:pei.ru@itri.org.tw
https://www.itri.org.tw/
工研院資訊與通訊研究所