【人工智能】NVIDIA研AI語音對話模型 模仿真實人聲助言障礙患者
科技
09:00
2021/09/02
▲ 半導體廠NVIDIA近日就衝破障礙,於INTERSPEECH 2021大會展示其正打造的AI語音對話模型,不但能用於線上客服、遊戲上,更可協助語言障礙患者在日常生活中使用。(圖片來源 : NVIDIA官網 )
人工智能(AI)技術日新月異,但其合成的聲音和真實人聲還有偏差,原因在於人類說話時帶有的複雜節奏、音調和音色,難以AI技術重現。半導體廠NVIDIA近日就衝破障礙,於INTERSPEECH 2021大會展示其正打造的AI語音對話模型,不但能用於線上客服、遊戲上,更可協助語言障礙患者在日常生活中使用。
NVIDIA是次打造的AI對話模型,能捕捉及模仿人類說話聲的細節,而此AI模型不只可用於配音、文字轉語音的功能及遊戲上,更可協助語言障礙患者,或幫助使用者用自己的聲音翻譯不同語言。甚至還能配合歌曲旋律,重現歌手表演,還能配合表達人聲背後的情感。
而目前這項研究成果的部分內容已透過NVIDIA NeMo工具套件成為開放原始碼,可在NGC容器及其他軟件中心取得,並經最佳化調整,在NVIDIA GPU高效執行。
【Spotify】Spotify推共享歌單功能 匹配、混合歌單增社交互動
除此之外,NVIDIA研究團隊目前仍進行對話式AI研究,包括自然語言處理、自動語音識別、關鍵字偵測、音訊增強等。
【遙距工作】疫情持續 Google重返辦公室政策將延至明年1月
責任編輯:張凱琳