【人工智能】NVIDIA研AI語音對話模型 模仿真實人聲助言障礙患者

科技 09:00 2021/09/02

分享:

半導體廠NVIDIA近日就衝破障礙,於INTERSPEECH 2021大會展示其正打造的AI語音對話模型,不但能用於線上客服、遊戲上,更可協助語言障礙患者在日常生活中使用。(圖片來源 : NVIDIA官網 )

人工智能(AI)技術日新月異,但其合成的聲音和真實人聲還有偏差,原因在於人類說話時帶有的複雜節奏、音調和音色,難以AI技術重現。半導體廠NVIDIA近日就衝破障礙,於INTERSPEECH 2021大會展示其正打造的AI語音對話模型,不但能用於線上客服、遊戲上,更可協助語言障礙患者在日常生活中使用。

NVIDIA是次打造的AI對話模型,能捕捉及模仿人類說話聲的細節,而此AI模型不只可用於配音、文字轉語音的功能及遊戲上,更可協助語言障礙患者,或幫助使用者用自己的聲音翻譯不同語言。甚至還能配合歌曲旋律,重現歌手表演,還能配合表達人聲背後的情感。

而目前這項研究成果的部分內容已透過NVIDIA NeMo工具套件成為開放原始碼,可在NGC容器及其他軟件中心取得,並經最佳化調整,在NVIDIA GPU高效執行。

【Spotify】Spotify推共享歌單功能 匹配、混合歌單增社交互動

除此之外,NVIDIA研究團隊目前仍進行對話式AI研究,包括自然語言處理、自動語音識別、關鍵字偵測、音訊增強等。

【醫療科技】以色列團隊3D打印腫瘤 擬培養癌細胞試新藥

【遙距工作】疫情持續 Google重返辦公室政策將延至明年1月

責任編輯:張凱琳

緊貼財經時事新聞分析,讚好hket Facebook 專版