︿
Top

DeepSeek正帶給AI產業一個反思的機會,以及找到了一條通往AI發展的大道

瀏覽次數:1254| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室 - 友子 發表於 2025年2月3日
facebook twitter wechat twitter
 
圖、DeepSeek正帶給AI產業一個反思的機會,以及找到了一條通往AI發展的大道

中國AI新創公司DeepSeek事件似乎激發了市場對未來AI發展的無限想像。2025年才剛過去一個月,DeepSeek引發了輝達等AI族群股暴跌,當然也引發了未來AI何去何從之戰。

由於現今事件已經冷靜下來,專家更可能深入探討這一事件可能引發的後續效應,卻也說明了輝達不可能永遠站在高點,AI一旦真的進入一般人的生活當中,低價和開放式平台可能才是正軌。

DigitalOcean認為DeepSeek AI是「AI的Android時刻(鑑於ChatGPT被比作AI的iPhone時刻)」,因為它展示了來自開源社區的突破性AI產品的可能性。

簡單來說,DeepSeek AI使AI和雲端運算變得民主化,因為它表明不需要數十億美元的投資就能實現引人注目的創新。它降低了中小企業和個人開發者使用AI的門檻。

無論是個人電腦、行動裝置,都可以得知低價才能廣泛提供運算資源,並帶給市場的爆炸性擴張。未來AI想要無所不在,OpenAI、Claude、Perplexity甚至Gemini這種封閉式平台由於成本過於高昂,難以實現這個潛力。

根據半導體研究和諮詢公司SemiAnalysis的一份新報告指出,DeepSeek V3的訓練成本「600萬美元」,這是錯誤的結論。他們認為,預訓練的花費絕不是模型實際花費的金額。根據預估,DeepSeek在硬體方面的支出遠高於5億美元。為了開發新的架構創新,在模型開發過程中,需要花費大量資金來測試新想法、新的架構理念。Multi-Head Latent Attention是DeepSeek的關鍵創新,其花了數月時間開發,耗費了整個團隊的人力時間和GPU小時。

因此,600萬美元的成本僅歸因於預訓練運行的GPU成本,這只是模型總成本的一部分。不包括硬體本身的研發和TCO等重要部分。以Claude 3.5 Sonnet的訓練成本為數千萬美元,但包含其進行的實驗、提出新的架構、收集和清理資料、支付員工薪水等等,讓Anthropic必須得從谷歌籌集數十億美元,也從亞馬遜籌集數百億美元。

SemiAnalysts認為DeepSeek的獨特之處在於他們首先實現了在較低成本之下,所獲得之功能水準。畢竟,DeepSeek的R1是一個非常好的模型,並且如此迅速地趕上推理優勢,客觀上令人印象深刻。

總之,DeepSeek的確帶給美國發展AI一個警訊,對於美國一直採取限制中國取得AI晶片的作法,似乎無法收到效果,反而激發中國新創公司在較少資源上,如何透過創新追上美國AI優勢,這說明了輝達想利用更先進製程發展AI晶片,是否有其必要的疑慮。

畢竟,現今產業從來都沒見過,在高成本環境下,可以爆發市場需求的例子。唯有開放和降低成本才可能讓AI市場真正進入噴發期,這種企業因為AI而獲得高利潤的時間或許再過幾年就會終止了。(1153字;圖1)


參考資料:
The AI bust is here. Computer World. 2025/01/29.
DeepSeek, Nvidia and the AI race that' s shaping the future. The Conversation. 2025/01/31.
DeepSeek' s hardware spend could be as high as $500 million, new report estimates. CNBC. 2025/01/31.


 
 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。