Etched融資5億美元：Sohu專用晶片挑戰Nvidia，一台伺服器取代160張H100

哈佛輟學生的十億美元野心

Etched的故事本身就是矽谷創業神話的典型樣本。公司由Gavin Uberti和Chris Zhu兩位哈佛大學輟學生創立，他們在大學期間即開始研究AI硬體加速問題。當他們意識到現有的通用GPU在運行Transformer模型時存在大量算力浪費，便做出了一個激進的決定：放棄通用性，打造一款完全為Transformer架構量身定製的專用晶片。

這一思路本身並不新穎——ASIC（特定應用積體電路）在加密貨幣挖礦和網路設備中已有廣泛應用。但在AI推論領域設計ASIC，需要做出一個關鍵判斷：Transformer架構是否會長期主導AI模型的設計？Uberti和Zhu賭它會。

這場豪賭目前的帳面回報是驚人的。在最新一輪融資中，由Stripes領投、Peter Thiel參與的5億美元投資使Etched的估值飆升至50億美元。加上此前多輪融資，Etched的累計融資總額已接近10億美元——對一家尚未大規模出貨的晶片公司而言，這是投資者信心的巨大體現。

Sohu晶片：極致專注的設計哲學

Sohu晶片的設計哲學可以用一句話概括：「只做一件事，但做到極致」。與Nvidia GPU的通用設計不同，Sohu將晶片上的每一個電晶體都用於加速Transformer模型的推論計算。

                    Sohu晶片核心規格
                    製程：台積電（TSMC）4奈米先進製程
記憶體：高頻寬記憶體（HBM），大容量配置
架構：完全為Transformer注意力機制（attention mechanism）優化
性能聲明：Transformer推論速度為Nvidia H100的20倍
效率聲明：單台Sohu伺服器可取代160張H100 GPU

                

Sohu之所以能聲稱如此驚人的性能提升，原因在於通用GPU需要支持大量Transformer推論不需要的功能。Nvidia H100的設計必須兼顧訓練和推論、CNN和Transformer、FP64科學計算和INT8量化推論等多種場景。這種通用性意味著大量晶片面積被用於Transformer推論用不到的功能單元。

Sohu則將所有晶片資源集中在Transformer的核心操作上——多頭注意力計算、KV緩存管理、前饋網路計算和解碼生成。通過移除所有非必要的功能模組，Sohu能夠在相同的晶片面積上部署更多專用計算單元，從而實現數量級的效率提升。

工作矽片的展示

值得注意的是，Etched已經展示了可工作的Sohu矽片（working silicon），這使其區別於許多僅停留在設計階段的AI晶片新創公司。在半導體行業中，「有設計」與「有能工作的晶片」之間存在巨大鴻溝，Etched跨越了這一關鍵門檻。

然而，業界觀察者指出了一個重要的限制條件：Etched的性能聲明尚未經過獨立第三方驗證。20倍的速度提升和160：1的替換比，這些數字是極為大膽的聲明，在缺乏獨立基準測試的情況下，應當以審慎態度看待。

性能聲明的解讀

半導體行業對性能對比聲明有大量先例，其中不乏選擇性引用和不對等對比的案例。在Etched公布獨立基準測試結果之前，其聲明存在幾個值得追問的問題：

20倍速度提升是在什麼模型規模、什麼批次大小、什麼精度設定下測得的？
160：1的替換比是否考慮了功耗、散熱和總體擁有成本（TCO）？
在真實生產負載而非實驗室理想條件下，性能表現如何？
對不同參數規模的Transformer模型（從70B到數兆參數），性能增益是否一致？

CEO的坦率承認：「這是對Transformer的豪賭」

在對Sohu晶片的討論中，最令人印象深刻的或許是CEO Gavin Uberti的坦率。他公開承認Sohu是「一場對Transformer的豪賭」（a bet on transformers），如果AI領域出現根本性的架構轉變，取代Transformer成為主流，那麼Sohu晶片將可能變得過時。

這種坦率在創業公司中極為罕見，但它也揭示了Etched商業模式中最大的結構性風險。回顧AI的歷史，主流架構的更迭並非不可想像：

                    AI主流架構的演變歷史
                    2012年前：傳統機器學習（SVM、隨機森林等）主導
2012-2017：卷積神經網路（CNN）成為視覺AI的標準架構
2017年至今：Transformer架構橫掃NLP、視覺、音頻等幾乎所有AI領域
未來？：狀態空間模型（SSM/Mamba）、混合架構、或全新範式可能出現

                

事實上，已經有跡象顯示Transformer可能面臨挑戰。Mamba等基於狀態空間模型的架構在某些任務上展現了與Transformer相當的性能，但計算效率更高。如果類似的替代架構在未來幾年內成熟，Etched可能面臨數十億美元投入化為烏有的風險。

挑戰Nvidia：大衛與歌利亞

Etched面臨的另一個巨大挑戰是它的對手——Nvidia。作為控制全球AI加速器市場70%至95%份額的絕對霸主，Nvidia不僅擁有最先進的硬體，還構建了以CUDA為核心的龐大軟體生態系統。

在AI晶片領域，硬體性能只是競爭的一個維度。軟體生態、開發者工具、客戶支持、量產能力和供應鏈管理同樣至關重要。Nvidia的CUDA生態系統經過十餘年的積累，已經成為AI開發者的默認平台。任何新進者，無論硬體性能多麼出色，都必須解決軟體相容性和生態系統遷移的問題。

Etched的差異化策略

Etched的策略是避免與Nvidia在通用AI加速器市場正面競爭，而是專注於大規模語言模型推論這一特定且快速增長的市場。隨著ChatGPT、Claude、Gemini等大型語言模型的用戶量爆發式增長，推論算力的需求正在急劇上升。如果Sohu能夠在這一細分市場提供顯著更優的性價比，即使整體生態系統不及Nvidia，也可能贏得一席之地。

此外，Etched瞄準的是雲端AI基礎設施提供商——這些客戶具備技術能力來整合新硬體，且對成本優化高度敏感。對於每天運行數十億次Transformer推論的超大規模數據中心而言，即使Sohu僅實現5倍（而非聲稱的20倍）效率提升，其經濟價值也將是巨大的。

AI專用晶片的競爭版圖

Etched並非唯一試圖挑戰Nvidia的公司。在AI專用晶片領域，一場激烈的競爭正在展開：

Google TPU：Google自研的Tensor Processing Unit，專為TensorFlow和JAX優化
Amazon Trainium/Inferentia：AWS自研晶片，主要服務於自家雲端客戶
Cerebras：巨型晶圓級晶片WSE-3，主攻訓練市場
Groq：LPU推論晶片，強調低延遲和確定性性能
SambaNova：可重配置數據流架構

但在這些競爭者中，Etched的策略是最為極端的——完全放棄通用性，將所有資源押注在單一架構上。這種策略如果成功，回報將是巨大的；如果失敗，損失也將是毀滅性的。

投資者的信心與風險

Peter Thiel的參與為Etched增添了重要的信譽背書。Thiel以投資革命性技術公司著稱，其投資組合包括PayPal、SpaceX和Palantir。但即便是Thiel的背書，也無法消除Sohu晶片面臨的核心風險——技術路線的不確定性和性能聲明的未驗證性。

從投資角度看，50億美元的估值意味著投資者相信Etched有能力從Nvidia手中搶奪數十億美元的推論市場份額。這一信念的基礎是兩個假設：Transformer架構將長期主導AI，以及Sohu的性能優勢確實如聲稱般顯著。任何一個假設被推翻，都可能導致估值的大幅縮水。

對香港AI產業的意義

對於香港的AI產業和研究機構而言，Etched的崛起傳遞了一個重要信息：AI基礎設施的格局正在發生變化。隨著專用晶片的出現，AI推論的成本結構可能發生根本性改變，這將直接影響AI應用的經濟可行性。

香港的AI企業和研究團隊在選擇計算基礎設施時，應當關注這一趨勢。未來的AI推論市場可能不再是Nvidia GPU的一家獨大，多元化的硬體選項將為不同應用場景提供更具成本效益的解決方案。

結語：創新者的勇氣與賭徒的風險

Etched和它的Sohu晶片代表了AI晶片產業中最純粹的創新精神——識別一個明確的技術低效率，然後以最激進的方式去解決它。10億美元的融資證明了市場對這一願景的認可，工作矽片的展示證明了技術的可行性。

但在半導體行業，從有工作原型到大規模商業成功之間的距離，往往比外界想像的要遙遠得多。Etched的最終成敗，將取決於Transformer架構的生命週期、性能聲明的實際驗證、以及它能否在Nvidia的龐大生態系統旁邊開闢出可持續的市場空間。這是一場值得關注的豪賭。