NVIDIA 正式出貨 Blackwell Ultra GB300：每張 GPU 8TB/s 記憶體頻寬，瞄準 AI 推理市場

在 3 月 GTC 大會上發布預告後，NVIDIA 的新一代旗艦 AI 加速器 Blackwell Ultra GB300 正式進入量產出貨階段，預計本季末前完成首批企業客戶的大規模交付。

核心規格躍升

GB300 相較前代 B200 有多項關鍵升級：

HBM3e 記憶體頻寬：單張 GB300 達到 8TB/s，是 H100 的近4倍，大幅降低大型語言模型推理時的記憶體瓶頸
FP4 精度原生支援：新增 FP4 張量核心，推理吞吐量在 FP4 精度下可達 FP8 的兩倍，適合已完成量化訓練的部署模型
單機 NVL72 機架：72 張 GB300 以 NVLink 全互聯，聚合顯存超過 13.5TB，可將完整的兆級參數模型載入單一機架，無需跨機通訊

推理優先戰略

NVIDIA 在本次出貨中特別強調 GB300 的「推理優先」定位。隨著 DeepSeek V4、GPT-5 等超大規模模型進入商業部署，AI 產業重心正從訓練逐步轉向推理，對高效能、低延遲、大容量顯存的加速器需求急劇上升。

NVIDIA CEO 黃仁勳在 GTC 演講中指出：「下一個 10 倍算力增長將發生在推理側，而不是訓練側。」GB300 正是為此而生。

競爭格局

面對 GB300，AMD 的 Instinct MI350X 預計 Q3 量產，Google 的 TPU v6（Trillium）持續在自家雲端擴大部署，而 AWS、Microsoft Azure、Google Cloud 均已確認將在 2026 年下半年提供 GB300 實例。值得關注的是，受美國出口管制影響，GB300 的出口限制規格與標準版存在差異，中國市場將繼續使用閹割版 H20 及其後繼型號。

台積電 3nm 製程加持

GB300 採用台積電 N3E（3奈米增強版）製程，封裝採用 CoWoS-L 技術，晶粒面積相比 B200 縮小約 15%，在同等功耗下運算密度顯著提升。整機 NVL72 系統功耗約 120kW，對資料中心電力與冷卻基礎設施提出嚴峻挑戰。

隨著 GB300 量產落地，2026 年的 AI 基礎設施軍備競賽已進入新的高度。