【機器學習】網絡瘋傳Google翻譯出錯 唯獨錯譯China breaks promise為「中國信守諾言」

科技 15:37 2021/01/18

分享:

有網民發現,Google翻譯出現雙重標準的錯誤,被質疑翻譯受政治因素影響。

相信不少人都會使用Google Translate作為翻譯工具,不過其準確性一向成疑。日前就有網民發現,Google翻譯出現雙重標準的錯誤,被質疑翻譯受政治因素影響。

【WhatsApp爭議】WhatsApp再爆私隱洩漏問題 Google搜尋結果出現用戶個人電話號碼

據網絡近日瘋傳,若使用Google的翻譯工具Google Translate時,在輸入英文「China breaks promises(中國破壞承諾)」,轉換成繁體中文翻譯時,竟然被翻譯成「中國信守諾言」,但「US breaks promises(美國破壞承諾)」就會翻譯做「美國違背諾言」。而本報記者今日亦有進行實測,發現不論是Google Translate的手機程式或是電腦網頁版,相關翻譯結果仍與網民的截圖一樣;而記者嘗試測試香港,發現「Hong Kong breaks promises」同樣會被翻譯為「香港信守諾言」。

China breaks promises(中國信守承諾)

US breaks promises(美國破壞承諾)

記者嘗試測試香港,發現「Hong Kong breaks promises」同樣會被翻譯為「香港信守諾言」。

事實上,Google翻譯出錯已非第一次,有Facebook專頁「前線科技人員」解釋指,幾十年前以舊式電腦進行翻譯的主要方法,是透過教導電腦程式學習辨認不同文法,但由於人類語言文法有大量例外用法,令效果一直強差人意。

【網絡安全】Facebook控告Chrome擴充程式開發商 涉暗中搜括用戶資料

【科企收購】Google宣布完成Fitbit收購 強調保護私隱不利用健康數據

不過,隨著硬件的提升令機器學習(Machine Learning)開始普及,研究人員開始循另一個方法,嘗試放棄文法,純粹利用大量數據建立資料庫,由機器分析資料並提供翻譯,避開電腦難以應付人類文法的缺失,而事實證明效果比傳統方法優勝。但專頁質疑,這種做法有其缺點,其中之一就是,結果會受制於數據資料庫的質素。由於Google的數據庫大部份資料從公開途徑獲得,因此當某類語言經常在某一國家/某種語言出現錯誤的解釋,經常都將「China breaks promises」翻譯成「中國信守諾言」,程式就很大機會一同「中伏」出錯。

責任編輯:施雯雯

緊貼財經時事新聞分析,讚好hket Facebook 專版