為什麼 AI 需要特別的晶片?GPU、TPU 入門解釋

Why AI Needs Special Chips: GPU and TPU Explained for Beginners

NVIDIA 的股票為什麼這麼熱門?因為它生產的 GPU(圖形處理器) 是訓練 AI 最重要的硬件。

但等等,普通電腦的晶片(CPU)不能做 AI 嗎?為什麼要用特別的晶片?

今天我們用簡單的比喻來解釋這件事。

CPU 和 GPU 有什麼不同?

CPU(普通電腦晶片)的特點: 想像一個超級聰明的人,能做各種複雜任務——回答問題、寫文章、解數學題——但一次只能做一件事。

GPU(圖形處理器)的特點: 想像1,000個普通工人,每個人只會做簡單的加減法,但他們可以同時一起工作

為什麼 AI 計算需要「1,000個工人」?

訓練 AI 的核心運算其實很簡單:大量的乘法和加法(叫做「矩陣計算」)。

就像你要算1,000,000道加法題:

  • CPU:一個聰明人算,每秒算1,000題 → 需要1,000秒
  • GPU:10,000個工人一起算 → 只需要0.1秒

AI 訓練需要做幾兆(billions)次這樣的計算,所以並行處理能力(同時算很多東西)非常重要。

NVIDIA GPU 有多強?

最新的 NVIDIA H100 GPU:

  • 包含 800 億個電晶體(比整個人腦神經元數量還多)
  • 每秒可以做 4,000萬億次浮點運算(FLOPS)
  • 一個 AI 訓練任務可能用到 10,000 個 H100 同時運作

整個系統的算力,超過了1990年代全球所有電腦加在一起!

TPU 又是什麼?

Google 覺得 NVIDIA GPU 太貴,所以自己設計了 TPU(張量處理器,Tensor Processing Unit)

TPU 比 GPU 更「專一」——它只做 AI 計算,不做遊戲畫面渲染,所以在 AI 任務上更高效、更省電。

Google 用 TPU 來訓練 Gemini,是自用的「秘密武器」。

為什麼普通人要關心 AI 晶片?

原因1:AI 服務的費用 AI 晶片越貴,訓練 AI 的成本就越高,最終你使用 AI 的費用也可能更高。

原因2:AI 發展速度 更強大的晶片 = 更快訓練更大的 AI = AI 能力更快提升。NVIDIA 每隔幾年推出新一代晶片,AI 能力也隨之跳躍式提升。

原因3:地緣政治 美國限制向中國出口高端 AI 晶片,這正在影響中美 AI 發展的速度,也影響全球科技格局。

原因4:環境影響 訓練一個大型 AI 模型消耗的電力,相當於幾千個家庭一年的用電量。AI 晶片的能效,直接影響 AI 產業的環境足跡。

最後:你的手機也有「小 GPU」

你的手機其實也有 GPU!每次你玩遊戲或者打開 AI 功能(如相機的美化效果),都是 GPU 在工作。

Apple 的 A 系列晶片和高通驍龍晶片都加入了「NPU(神經網路處理器)」,專門用來跑手機上的 AI 功能。

AI 晶片不只在遙遠的數據中心,也在你的口袋裡。