關鍵詞:智能語音
中投顧問:2019-2023年中國智能語音行業影響因素
一、有利因素
(一)政策支持
2017年11月15日,科技部召開《新一代人工智能發展規劃》暨重大科技項目啟動會,會上宣布了首批四家國家新一代人工智能開放創新平臺名單,明確依托科大訊飛建設智能語音國家新一代人工智能開放創新平臺。
2018年3月5日,國務院總理李克強在十三屆全國人大一次會議作政府工作報告時表示,要加強新一代人工智能研發應用,在醫療、養老、教育、文化、體育等多領域推進“互聯網+”,這是繼2017年之后,“人工智能”再次被寫入政府工作報告。
(二)眾多互聯網巨頭紛紛開發智能語音市場
在語音生態系統方面,百度宣布語音識別技術及能力全面開放。騰訊、搜狗語音開放平臺相繼上線。
在語音技術應用方面,各大廠商對家居、車載、可穿戴等環節的關注明顯升溫。智能家居領域,百度發布了Baiduihome,阿里聯合智能家電廠商推出天貓魔盒,搜狗聯手魅族發布了魅族電視盒子。
智能車載領域,百度分別推出了手機車機智能互聯的產品Carlife,車的私有云服務平臺MyCar,和智能語音人機交互方式的智能行車助手CoDriver。阿里云和上汽合作推出車載操作系統,騰訊發布了路寶APP+路寶盒子,可與騰訊云連接,以實現車輛診斷、油耗分析、車友社交等功能。搜狗則和四維圖新合作,推出飛歌導航。
可穿戴領域,百度采取扶持外部產品,內置百度服務,形成開放生態思路:分別推出了Inside智能硬件平臺,基于健康云的Dulife智能健康平臺,以及百度手表應用,以吸引硬件廠商加入。
(三)智能語音技術成熟,商業化應用成為可能
深度學習、高性能運算平臺和大數據是人工智能技術取得突破的核心助推力。深度學習端到端解決了特征表示與序列影射的問題,使得人工智能的性能得到了快速提升;而互聯網時代海量的數據又不斷為算法模型提供了訓練材料,同時,云計算的興起和高性能的運算平臺為智能化提供了強大的運算能力和服務能力。
在語音識別率方面,百度、谷歌,科大訊飛等主流平臺識別準確率均在96%以上,穩定的識別能力為語音技術的落地提供了可能。
(四)智能語音交互的便利性
首先,語音交互能夠創造全新的“伴隨式”場景。試想一下以后早晨起床后你無需再大動干戈,又是開電視又是燒開水又是洗漱刷牙的,把自己搞得一團糟,只需要動動嘴皮子就能“隔空”操作,讓自己不再慌亂。因此,語音交互能極大提高人們在某些不方便使用手和眼睛的場景中的效率。
其次,隨著智能設備影響的擴大,人工智能語音交互能普及到更廣泛的人群,比如視力不好,手腳不靈活的老年人,不識字的低齡兒童、盲人等生活難以自理的群體,讓他們的生活更方便。
最后,通過語音交互,人工智能可以實現自主學習,變得更像人類,在此基礎上,人工智能將更順利地融入到用戶家庭生活中,扮演陪伴者或教育者的角色,滿足用戶現實需求的同時,滿足用戶的心理需求,這是人工智能未來發展的一大方向。
二、不利因素
(一)人才稀缺
隨著智能語音及人工智能技術產業化趨勢明顯,國外知名IT企業紛紛對智能語音業務加大投入,勢必造成語音技術國際競爭的加劇和社會對語音技術人才需求的增大,在風險投資的追捧下,人工智能領域高端人才離職創業數量大大增加,微軟、百度、阿里、騰訊、IBM、英特爾中國等近年都出現了研究院院長等核心人才離職創業的現象。同時由于國內智能語音及人工智能行業的特殊性、高水平科研人才的稀缺性以及人才培養的滯后性,智能語音及人工智能技術人才將面臨持續短缺,能否吸引和培養高水平的人才隊伍是行業今后發展的潛在風險。
(二)低數據資源與多語言
目前大部分語音識別的研究和應用,主要是基于一些大語種,比如說英語、漢語、阿拉伯語和法語等等,我們知道世界上一共有6900多種語言,如何快速的實現一套基于任何語言的語言識別系統是非常困難的,它也具有重大的戰略意義。包括美國IARPA這幾年的Babel計劃,以及之前DARPA的GALE計劃,考慮到中國的國情我們有56個民族,所以構建一套多語言低數據資源下的語音識別系統是非常關鍵和具有實際價值的。