Mozilla公開收集港人聲音 製作粵語辨識引擎

科技 17:34 2020/06/01

分享:

Mozilla周五(29日)在官網表示,正公開收集香港人的聲音樣本,以製作開源廣東話辨識引擎,以製作開源廣東話辨識引擎。

香港人講廣東話,理所當然亦容易至極,不過你是否願意貢獻你的聲音,去幫助研發粵語的智能語音技術呢?Mozilla周五(29日)在官網表示,研發語音辨識技術時,開發者需要非常大量的語音數據,惟目前大部分語音數據都相當昂貴,這些系統皆被大企業壟斷,故正公開收集香港人的聲音樣本,以製作開源廣東話辨識引擎,使中小企和獨立開發者也用到相關技術。

Mozilla於2017年,發起開源語音募集專案Common Voice,是一個讓機器學會真人說話方式的計劃,旨在打破由「大台」壟斷的局面,讓語音數據能被公開自由地使用。為此,Mozilla一直努力地研發開源語音辨識引擎「Deep Speech」,迄今涵蓋全球多個語言。

不想錄音,參加者大可檢驗其他人的廣東話是否正確。

蘋果iOS 13增廣東話鍵盤 配詞一齊「估估吓」

Google助理廣東話版正式推出

至於如何貢獻廣東話呢?Mozilla指出,有3方面需要幫忙:提供公共領域的廣東話句子,審查句子的正確性;給句子錄音;或檢驗其他貢獻者的錄音是否與句子相符。

Mozilla又稱,收集到的句子越豐富,聲音越多樣化,對機器語音辨識和語音合成越有幫助,並鬼馬打氣:「香港人,支持廣東話靠你啦!」

責任編輯:姚慧儀

緊貼財經時事新聞分析,讚好hket Facebook 專版