NVIDIA 正式出貨 Blackwell Ultra GB300:每張 GPU 8TB/s 記憶體頻寬,瞄準 AI 推理市場
NVIDIA Blackwell Ultra GB300 begins shipping: 8TB/s memory bandwidth targets inference dominance
在 3 月 GTC 大會上發布預告後,NVIDIA 的新一代旗艦 AI 加速器 Blackwell Ultra GB300 正式進入量產出貨階段,預計本季末前完成首批企業客戶的大規模交付。
核心規格躍升
GB300 相較前代 B200 有多項關鍵升級:
- HBM3e 記憶體頻寬:單張 GB300 達到 8TB/s,是 H100 的近4倍,大幅降低大型語言模型推理時的記憶體瓶頸
- FP4 精度原生支援:新增 FP4 張量核心,推理吞吐量在 FP4 精度下可達 FP8 的兩倍,適合已完成量化訓練的部署模型
- 單機 NVL72 機架:72 張 GB300 以 NVLink 全互聯,聚合顯存超過 13.5TB,可將完整的兆級參數模型載入單一機架,無需跨機通訊
推理優先戰略
NVIDIA 在本次出貨中特別強調 GB300 的「推理優先」定位。隨著 DeepSeek V4、GPT-5 等超大規模模型進入商業部署,AI 產業重心正從訓練逐步轉向推理,對高效能、低延遲、大容量顯存的加速器需求急劇上升。
NVIDIA CEO 黃仁勳在 GTC 演講中指出:「下一個 10 倍算力增長將發生在推理側,而不是訓練側。」GB300 正是為此而生。
競爭格局
面對 GB300,AMD 的 Instinct MI350X 預計 Q3 量產,Google 的 TPU v6(Trillium)持續在自家雲端擴大部署,而 AWS、Microsoft Azure、Google Cloud 均已確認將在 2026 年下半年提供 GB300 實例。值得關注的是,受美國出口管制影響,GB300 的出口限制規格與標準版存在差異,中國市場將繼續使用閹割版 H20 及其後繼型號。
台積電 3nm 製程加持
GB300 採用台積電 N3E(3奈米增強版)製程,封裝採用 CoWoS-L 技術,晶粒面積相比 B200 縮小約 15%,在同等功耗下運算密度顯著提升。整機 NVL72 系統功耗約 120kW,對資料中心電力與冷卻基礎設施提出嚴峻挑戰。
隨著 GB300 量產落地,2026 年的 AI 基礎設施軍備競賽已進入新的高度。