依圖語音識別技術 開放第三方使用

科技 19:10 2018/12/11

分享:

依圖首席創新官呂昊認為現今語音識別技術仍受制於不同場景,提升核心技術才是打破中文語音識別發展緩慢的關鍵。

漢語不時出現同音不同意的情況,增加電腦語音識別的困難。不過人工智能(A.I.)公司依圖科技開發的中文語音識別技術取得新突破,最新準確度達96.29%刷新紀錄,並宣布與微軟合作推出語音開放平台,將語音識別技術開放予第三方應用開發者。

準確度達96.29%刷新紀錄

依圖在全球最大型的中文開源數據庫AISHELL-2,通過遠近、安靜聊天、語音節目、電話等多項測試,得出高達96.29%的準確率,字錯率僅為3.71%,大幅拋離第二名約20%。依圖表示,語音識別是人工智能理解世界的重要組成部分,也是「人人交互」、「人機交互」的最重要入口。

由於語音識別技術取得突破,依圖亦宣布在微軟「天青雲」推出語音開放平台,將技術開放予第三方應用開發者,有助開發語音導航、室內裝置控制、語音文件檢索、資料輸入等涉及智能語音技術的產業。依圖預計未來半年至一年,語音識別技術的演算方法將會再升級,屆時更多複雜場景可被解鎖,為行業應用帶來更大價值。

緊貼財經時事新聞分析,讚好hket Facebook 專版