哈佛輟學生的十億美元野心
Etched的故事本身就是矽谷創業神話的典型樣本。公司由Gavin Uberti和Chris Zhu兩位哈佛大學輟學生創立,他們在大學期間即開始研究AI硬體加速問題。當他們意識到現有的通用GPU在運行Transformer模型時存在大量算力浪費,便做出了一個激進的決定:放棄通用性,打造一款完全為Transformer架構量身定製的專用晶片。
這一思路本身並不新穎——ASIC(特定應用積體電路)在加密貨幣挖礦和網路設備中已有廣泛應用。但在AI推論領域設計ASIC,需要做出一個關鍵判斷:Transformer架構是否會長期主導AI模型的設計?Uberti和Zhu賭它會。
這場豪賭目前的帳面回報是驚人的。在最新一輪融資中,由Stripes領投、Peter Thiel參與的5億美元投資使Etched的估值飆升至50億美元。加上此前多輪融資,Etched的累計融資總額已接近10億美元——對一家尚未大規模出貨的晶片公司而言,這是投資者信心的巨大體現。
Sohu晶片:極致專注的設計哲學
Sohu晶片的設計哲學可以用一句話概括:「只做一件事,但做到極致」。與Nvidia GPU的通用設計不同,Sohu將晶片上的每一個電晶體都用於加速Transformer模型的推論計算。
Sohu晶片核心規格
- 製程:台積電(TSMC)4奈米先進製程
- 記憶體:高頻寬記憶體(HBM),大容量配置
- 架構:完全為Transformer注意力機制(attention mechanism)優化
- 性能聲明:Transformer推論速度為Nvidia H100的20倍
- 效率聲明:單台Sohu伺服器可取代160張H100 GPU
Sohu之所以能聲稱如此驚人的性能提升,原因在於通用GPU需要支持大量Transformer推論不需要的功能。Nvidia H100的設計必須兼顧訓練和推論、CNN和Transformer、FP64科學計算和INT8量化推論等多種場景。這種通用性意味著大量晶片面積被用於Transformer推論用不到的功能單元。
Sohu則將所有晶片資源集中在Transformer的核心操作上——多頭注意力計算、KV緩存管理、前饋網路計算和解碼生成。通過移除所有非必要的功能模組,Sohu能夠在相同的晶片面積上部署更多專用計算單元,從而實現數量級的效率提升。
工作矽片的展示
值得注意的是,Etched已經展示了可工作的Sohu矽片(working silicon),這使其區別於許多僅停留在設計階段的AI晶片新創公司。在半導體行業中,「有設計」與「有能工作的晶片」之間存在巨大鴻溝,Etched跨越了這一關鍵門檻。
然而,業界觀察者指出了一個重要的限制條件:Etched的性能聲明尚未經過獨立第三方驗證。20倍的速度提升和160:1的替換比,這些數字是極為大膽的聲明,在缺乏獨立基準測試的情況下,應當以審慎態度看待。
性能聲明的解讀
半導體行業對性能對比聲明有大量先例,其中不乏選擇性引用和不對等對比的案例。在Etched公布獨立基準測試結果之前,其聲明存在幾個值得追問的問題:
- 20倍速度提升是在什麼模型規模、什麼批次大小、什麼精度設定下測得的?
- 160:1的替換比是否考慮了功耗、散熱和總體擁有成本(TCO)?
- 在真實生產負載而非實驗室理想條件下,性能表現如何?
- 對不同參數規模的Transformer模型(從70B到數兆參數),性能增益是否一致?
CEO的坦率承認:「這是對Transformer的豪賭」
在對Sohu晶片的討論中,最令人印象深刻的或許是CEO Gavin Uberti的坦率。他公開承認Sohu是「一場對Transformer的豪賭」(a bet on transformers),如果AI領域出現根本性的架構轉變,取代Transformer成為主流,那麼Sohu晶片將可能變得過時。
這種坦率在創業公司中極為罕見,但它也揭示了Etched商業模式中最大的結構性風險。回顧AI的歷史,主流架構的更迭並非不可想像:
AI主流架構的演變歷史
- 2012年前:傳統機器學習(SVM、隨機森林等)主導
- 2012-2017:卷積神經網路(CNN)成為視覺AI的標準架構
- 2017年至今:Transformer架構橫掃NLP、視覺、音頻等幾乎所有AI領域
- 未來?:狀態空間模型(SSM/Mamba)、混合架構、或全新範式可能出現
事實上,已經有跡象顯示Transformer可能面臨挑戰。Mamba等基於狀態空間模型的架構在某些任務上展現了與Transformer相當的性能,但計算效率更高。如果類似的替代架構在未來幾年內成熟,Etched可能面臨數十億美元投入化為烏有的風險。
挑戰Nvidia:大衛與歌利亞
Etched面臨的另一個巨大挑戰是它的對手——Nvidia。作為控制全球AI加速器市場70%至95%份額的絕對霸主,Nvidia不僅擁有最先進的硬體,還構建了以CUDA為核心的龐大軟體生態系統。
在AI晶片領域,硬體性能只是競爭的一個維度。軟體生態、開發者工具、客戶支持、量產能力和供應鏈管理同樣至關重要。Nvidia的CUDA生態系統經過十餘年的積累,已經成為AI開發者的默認平台。任何新進者,無論硬體性能多麼出色,都必須解決軟體相容性和生態系統遷移的問題。
Etched的差異化策略
Etched的策略是避免與Nvidia在通用AI加速器市場正面競爭,而是專注於大規模語言模型推論這一特定且快速增長的市場。隨著ChatGPT、Claude、Gemini等大型語言模型的用戶量爆發式增長,推論算力的需求正在急劇上升。如果Sohu能夠在這一細分市場提供顯著更優的性價比,即使整體生態系統不及Nvidia,也可能贏得一席之地。
此外,Etched瞄準的是雲端AI基礎設施提供商——這些客戶具備技術能力來整合新硬體,且對成本優化高度敏感。對於每天運行數十億次Transformer推論的超大規模數據中心而言,即使Sohu僅實現5倍(而非聲稱的20倍)效率提升,其經濟價值也將是巨大的。
AI專用晶片的競爭版圖
Etched並非唯一試圖挑戰Nvidia的公司。在AI專用晶片領域,一場激烈的競爭正在展開:
- Google TPU:Google自研的Tensor Processing Unit,專為TensorFlow和JAX優化
- Amazon Trainium/Inferentia:AWS自研晶片,主要服務於自家雲端客戶
- Cerebras:巨型晶圓級晶片WSE-3,主攻訓練市場
- Groq:LPU推論晶片,強調低延遲和確定性性能
- SambaNova:可重配置數據流架構
但在這些競爭者中,Etched的策略是最為極端的——完全放棄通用性,將所有資源押注在單一架構上。這種策略如果成功,回報將是巨大的;如果失敗,損失也將是毀滅性的。
投資者的信心與風險
Peter Thiel的參與為Etched增添了重要的信譽背書。Thiel以投資革命性技術公司著稱,其投資組合包括PayPal、SpaceX和Palantir。但即便是Thiel的背書,也無法消除Sohu晶片面臨的核心風險——技術路線的不確定性和性能聲明的未驗證性。
從投資角度看,50億美元的估值意味著投資者相信Etched有能力從Nvidia手中搶奪數十億美元的推論市場份額。這一信念的基礎是兩個假設:Transformer架構將長期主導AI,以及Sohu的性能優勢確實如聲稱般顯著。任何一個假設被推翻,都可能導致估值的大幅縮水。
對香港AI產業的意義
對於香港的AI產業和研究機構而言,Etched的崛起傳遞了一個重要信息:AI基礎設施的格局正在發生變化。隨著專用晶片的出現,AI推論的成本結構可能發生根本性改變,這將直接影響AI應用的經濟可行性。
香港的AI企業和研究團隊在選擇計算基礎設施時,應當關注這一趨勢。未來的AI推論市場可能不再是Nvidia GPU的一家獨大,多元化的硬體選項將為不同應用場景提供更具成本效益的解決方案。
結語:創新者的勇氣與賭徒的風險
Etched和它的Sohu晶片代表了AI晶片產業中最純粹的創新精神——識別一個明確的技術低效率,然後以最激進的方式去解決它。10億美元的融資證明了市場對這一願景的認可,工作矽片的展示證明了技術的可行性。
但在半導體行業,從有工作原型到大規模商業成功之間的距離,往往比外界想像的要遙遠得多。Etched的最終成敗,將取決於Transformer架構的生命週期、性能聲明的實際驗證、以及它能否在Nvidia的龐大生態系統旁邊開闢出可持續的市場空間。這是一場值得關注的豪賭。