AI大戰|DeepSeek據報因使用華為昇騰芯片訓練遇持續技術問題 推遲發布新AI模型
股市
撰文: 梁浩碩
發布時間: 2025/08/14 15:05
最後更新: 2025/08/14 15:54
▲ AI大戰|DeepSeek據報因使用華為昇騰芯片訓練遇持續技術問題 推遲發布新AI模型
DeepSeek據報因未能使用華為昇騰芯片進行訓練,因而成為其新模型從5月推遲發布的主要原因。外媒引述知情人士報道,DeepSeek在1月發布其R1模型後,受到當局鼓勵,採用華為的昇騰(Ascend)處理器,而非使用英偉達(美:NVDA)的芯片來訓練AI模型。
不過,DeepSeek在使用華為昇騰芯片進行R2訓練的過程中,遇到持續的技術問題,促使其使用英偉達芯片進行訓練,使用華為芯片進行推理。
據知情人士透露,華為派了工程師團隊前往DeepSeek辦公室,以助使用其AI芯片開發R2模型,惟即使團隊在場,DeepSeek仍無法在昇騰芯片上成功進行訓練。知情人士表示,DeepSeek仍在與華為合作,以使該模型與昇騰芯片相容進行推理。
報道稱,DeepSeek困境表明中國芯片在關鍵任務上仍落後於美國競爭對手,凸顯中國在技術自給自足面臨的挑戰。