【機器學習】AI創新遇瓶頸? 近四成機器學習從業員:無提高模型性能數據

科技 11:57 2022/07/06

分享:

分享:

對ML從業者來說,數據質量是他們成功的最重要因素之一。(法新社)

企業藉人工智能(AI)進行機器學習(ML),可自動化分析數據並進行預測,以更高效率優化模型性能。不過,根據AI數據平台Scale AI的報告,有37%機器學習從業員表示,由於未能獲得高質量的數據,因此無法提高模型性能。

【數碼分身】西門子夥Nvidia 打造「工業元宇宙」

Scale AI向1,300多名來自Meta、Amazon、Spotify等公司的ML從業員進行調查,以了解ML生命周期在每一個階段,包括從數據收集和註釋,到模型開發、部署和監測的情況,以了解AI創新的瓶頸所在及成功之處。

【人工智能】Shell加速能源轉型 AI布局改善端對端流程

對ML從業者來說,數據質量是他們成功的最重要因素之一,而根據受訪者的說法,這也是最難克服的挑戰。報告提到,37%的受訪者表示他們沒有改善模型性能所需的各種數據,而且大多數人的訓練數據更會遇上質量差的問題。

67%訓練數據  存雜音問題

排名前三的數據質量問題,分別是數據雜音(67%)、數據偏見(47%)和領域差距(47%),而只有9%受訪者表示他們的訓練數據沒有以上問題。

Scale AI建議,ML團隊可考慮與負責數據註釋(Data Annotation)的企業合作,克服數據整理和註釋質量方面的挑戰,加速模型部署。如果完全沒有與這些公司合作,很可能需花費超過三個月的時間來獲得註釋數據。

【香港回歸25周年系列】物流運轉 國際機遇

《創業ideas》每集請來香港企業品牌,分享疫下營商Tips。即看最新一集:

責任編輯:陳卓賢

開啟hket App,閱讀全文
緊貼財經時事新聞分析,讚好hket Facebook 專版
訂閱《香港經濟日報》電郵通訊
收取第一手財經新聞資訊 了解更多投資理財知識 提交代表本人同意收取香港經濟日報集團所發出的推廣訊息,你也可以查閱本網站的私隱政策使用條款