AI新創公司 Cerebras 推出新款 5奈米WSE-3 的晶圓級AI晶片
科技產業資訊室(iKnow) - 瑞課 發表於 2024年3月21日
圖、AI新創公司 Cerebras 推出新款 5奈米WSE-3 的晶圓級AI晶片
美國AI新創公司Cerebras於3月13日宣布了其Wafer Scale Engine 3 (WSE-3)的推出,其在性能上是前代WSE-2的兩倍,同時功耗和價格保持不變。WSE-3採用5奈米技術製程,內含4兆顆電晶體,專門為訓練大規模AI模型而設計。同時,Cerebras也推出了基於WSE-3的Cerebras CS-3 AI超級計算機,它透過900,000個最優化的AI運算核心,實現了高達125 PFLOPS的AI運算效能。
表1、Cerebras WSE-3、WSE-2與Nvidia H100晶片規格的比較
項目 |
Cerebras WSE-3 |
Cerebras WSE-2 |
Nvidia H100 |
晶片大小 |
46,225 mm² |
46,225 mm² |
826 mm² |
核心數 |
900,000 |
850,000 |
16,896 FP32 + 528 Tensor |
記憶體 |
44 GB SRAM |
40 GB SRAM |
0.05 GB SRAM + 80 GB HBM |
記憶體頻寬 |
21 PB/s |
20 PB/s |
0.003 PB/s |
傳輸頻寬 |
214 PB/s |
220 PB/s |
0.0576 PB/s |
製程 |
5nm |
7nm |
4nm |
WSE-3的關鍵規格包括採用台積電5奈米製程技術,並搬1.5TB、12TB或1.2PB的外部記憶體配置,使其能夠訓練達2,400億個參數的AI模型。
Cerebras WSE-3的架構設計專門針對AI運算最佳化,帶來三大核心優勢:
- 更多的AI運算核心:WSE-3配置高達900,000個AI運算核心,每個核心都能獨立編程,專為張量的稀疏線性代數運算最佳化,提供更好的神經網路訓練與深度學習推理基礎。因此,讓WSE-3在效能和靈活性方面達到了突出的效果。
- 更大記憶體容量與頻寬:WSE-3搭載44GB的SRAM,均勻分佈於晶片表面,為每個核心提供快速存取高速記憶體的能力,並享有高達21PB/s的極高頻寬,大大超越了市場上的其他解決方案。
- 更大的傳輸頻寬:WSE-3的先進晶片間連接技術克服了傳統通過線纜連接眾多小設備時的通信延遲和效率問題,提供了高達214Pb/s的運算核心間傳輸頻寬,是圖形處理器間傳統頻寬的3715倍,這一個特性使WSE-3在處理大規模AI運算任務時更加高效。
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。
|