【創業兵團】港大生研配對平台 眾包蒐數據助企業訓練AI

科技 14:37 2020/01/14

分享:

Datax創辦人黃偉俊(中)透露,曾因收集及分析數據令他苦不堪言,因此萌生開創收集及標籤數據平台的念頭。

人工智能(AI)是當前熱門話題之一,在社交媒體、企業服務、學術等多個領域都會應用到。在AI產業高速發展的背後,數據標註(Labelling)是不可或缺的一部分,亦是最繁複的步驟。初創公司Datax看準機會,開發手機應用程式配對平台,招募貢獻者提供數據,藉此助企業及研究人員提升AI系統的數據訓練效率。

Datax是由5位香港大學畢業生在2017年創辦,創辦人之一的龍羽騫(Hinnes)指出,AI應用增長迅速,需要大量準確的訓練數據。但面對數以十萬計的數據,要清楚知道哪些數據合用,都須透過人手逐一分類及處理。

>>>促保險業界數碼轉型 再保險公司研自動化系統

另一創辦人黃偉俊(Kevin)就以其大學時期的親身經歷舉例,當時其中一份功課是助時裝公司訓練其AI軟件,利用AI預測未來時尚趨勢。他們需要在網絡紅人的社交媒體中蒐集大量數據,並需將過千萬張相片按衣服風格逐一分類,花上相當長的時間,令他苦不堪言。「就算我24小時不斷工作,單一人手收集到的數據依然有限。何況一些大企業,要處理的數據比我當時還要多數倍。」

>>>華納兄弟利用AI預測電影票房 制定發行策略

獻數據後獲獎賞 家庭主婦都可參與

因此,他們決定開發數據收集和標籤平台Datax,以「眾包方式」助企業降低數據分析及處理的成本及人手。Kevin提到,Datax是一個中介平台,為數據收集者及數據貢獻者進行配對。「數據收集者指的是企業及研究人員等,而貢獻者則可是任何人,就連家庭主婦都可以註冊成為用戶。」當收集者需要某些數據時,就可在平台上頒布任務,尋求貢獻者的協助。

貢獻者完成任務後,便可獲應得的獎賞,包括金錢、超市、網店優惠券等。Datax於去年4月正式在市場上推出,截至現時貢獻者用戶已達1,500人。Hinnes坦承,目前用戶數目仍有進步空間。

貢獻者完成任務後,便可獲應得的獎賞,包括金錢、超市、網店優惠券等。(陳智良攝)

分發任務予目標客群

Kevin以台灣網絡廣告公司為例,他指該廣告公司期望透過數據,分析出最吸引消費者的廣告元素。而該公司就上傳了5,000張海報到平台上,平台就按其需要及目標客群,自動分發任務予合適的註冊用戶。

用戶透過程式在屏幕上選擇海報上的品牌標誌,以及圈出用戶認為廣告內最矚目的地方。(受訪者提供圖片)

用戶只需透過手機應用程式,在屏幕上選擇海報上的品牌標誌,以及圈出用戶認為廣告內最矚目的地方,該公司就能透過這些數據,得知哪些元素最能吸引消費者,並利用這些數據訓練AI。他補充,根據該廣告公司提供的資料,以往其公司需約6星期作數據標註,但透過用戶幫忙後,可縮短至少於兩星期。

該公司就能透過這些數據,得知哪些元素最能吸引消費者。(受訪者提供圖片)

記者:曾曉汶

緊貼財經時事新聞分析,讚好hket Facebook 專版