中國AI新創公司並未因為美國晶片制裁而落後美國甚多
科技產業資訊室 - 茋郁 發表於 2024年12月30日
圖、中國AI新創公司並未因為美國晶片制裁,而落後美國甚多
即使受到美國限制中國獲得輝達的AI晶片,中國新創公司找到較少地使用運算能力來提高效能的大型語言模型之方法,這讓美國許多專家感到驚訝中國似乎正在迎頭趕上OpenAI和Anthropic的推理模型。
DeepSeek是一家由中國最成功的對沖基金經理人資助的新創公司之一,於2024年11月發布了其最新LLM的預覽版。該程式的能力與OpenAI名為o1的推理模型相比毫不遜色。
12月,其他中國公司也發表了類似的聲明。由阿里巴巴和騰訊支持的新創公司Moonshot AI表示,它開發了一種專門研究數學的模型,其能力接近o1,而阿里巴巴表示,其自己的一個實驗研究模型在數學方面優於美國模型的預覽版。
自2023年年底以來,AI開發人員愈來愈多地使用一種稱為「專家混合」(mixture of experts;MoE)的技術,其中初始路由機制將問題引導至專門的專家模型。這項流程降低了對晶片的要求。
騰訊11月發布的MoE模型的表現可與Meta於7月推出的Llama 3.1模型相媲美。研究人員審閱了兩家公司發表的論文後表示,騰訊的模型訓練所用的運算能力可能只有Meta所用運算能力的十分之一左右。
2021年,DeepSeek將大約10,000顆輝達A100晶片連接起來,形成一個用於AI 訓練的集群,稱為Fire-Flyer 2。DeepSeek於2024年5月的MoE模型的論文,該模型採用了一種更有效地處理數據的技術,受到了業界的廣泛關注。DeepSeek在2024年8月表示,Fire-Flyer 2的性能接近包含類似晶片的輝達系統,但中國系統的成本更低,能耗也更低。
Anthropic的聯合創始人Jack Clark認為,中國繞過出口管制的一個方法是利用它可以訪問的硬體建構極其優秀的軟體和硬體訓練堆疊。這很可能讓中國在AI模型的表現,就像其在電動車、無人機和其他技術一樣。
DeepSeek 專注於開源模型,強調數學和編碼。Moonshot憑藉其聊天機器人Kimi贏得了中國消費者的青睞,並以其處理長文本的能力而聞名。
目前,中國AI新創公司的估值只是OpenAI等美國公司的一小部分,因為市場投資者不確定它們將商業化獲利能力。可是不可否認的是,即使美國持續打壓中國AI晶片領域,其中國是不會放棄在AI尋求更大突破的。因此,這一場美國和中國,甚至和歐洲之間的AI戰爭不會停止,也不會因為晶片限制或地緣政治干擾,就讓這一場戰爭看起來是美國穩贏的局面。中國的自主突防而且活得很好,或許就是美國最擔心的事情了!(1023字;圖1)
參考資料:
Don’t Look Now, but China’s AI Is Catching Up Fast. Wall Street Journal. 2024/12/24.
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。
|