GLM-5:智譜的雄心之作

智譜AI是中國最具影響力的AI企業之一,由清華大學知識工程實驗室(KEG)孵化而來,長期深耕大語言模型技術。此次發布的GLM-5代表了該公司技術路線的重要飛躍——不僅在模型規模和性能上實現了跨越式提升,更在開源策略上展現了與國際接軌的決心。

根據智譜官方公布的數據,GLM-5在多個編程相關基準測試中表現亮眼,宣稱在SWE-Bench等關鍵指標上逼近Anthropic的Claude Opus 4.5——後者目前被廣泛認為是全球編程能力最強的商業模型之一。此外,GLM-5在部分測試中的表現超過了Google的Gemini 3 Pro。不過需要指出的是,CNBC在報導中提到這些性能宣稱尚未得到獨立驗證。

GLM-5核心亮點

  • 編程能力:宣稱逼近Claude Opus 4.5,在部分基準測試中超越Gemini 3 Pro(未經獨立驗證)
  • 代理能力:增強的長時間運行代理(long-running agent)功能,支持複雜多步驟任務
  • 開源策略:完全開源發布,降低全球開發者使用門檻
  • 市場反應:發布後相關股價大幅上漲
  • 發布時間:2026年2月,中國AI模型密集發布窗口期

編程與代理:兩大核心突破

GLM-5最受關注的兩大能力提升分別是編程和AI代理。在編程方面,智譜團隊針對代碼理解、生成、調試和重構進行了深度優化。與前代GLM-4相比,GLM-5在處理大型代碼庫、跨文件依賴關係分析和複雜軟件工程任務上有顯著提升。這使其在2026年的AI編程助手競爭中獲得了一席之地。

在代理能力方面,GLM-5引入了增強的長時間運行代理框架。這意味着模型不再局限於單次問答交互,而是能夠維持長期的任務執行上下文,在複雜的多步驟工作流程中持續推進目標。這一能力對於軟件開發、數據分析和自動化辦公等場景具有重大實用價值。

為什麼編程能力至關重要

在2026年的AI競爭格局中,編程能力已經成為衡量大語言模型綜合實力的核心指標之一。這不僅因為編程本身是一個巨大的商業市場——GitHub Copilot、Cursor、Claude Code等工具正在重塑軟件開發行業——更因為編程能力反映了模型在邏輯推理、結構化思維和長鏈條執行方面的底層能力。一個編程能力強大的模型,往往在其他複雜認知任務上也表現出色。

中國AI的二月攻勢

GLM-5的發布並非孤立事件,而是2026年2月中國AI模型密集發布潮的一部分。在短短數週內,多家中國AI企業相繼推出了前沿模型:

  • MiniMax M2.5:以1/20的成本在SWE-Bench上逼近Claude Opus 4.6的80.8%得分
  • 快手Seedance 2.0:在視頻生成領域超越了OpenAI的Sora
  • 阿里巴巴Qwen:日活躍用戶從700萬激增至5800萬,增長超過8倍
  • 智譜GLM-5:編程能力挑戰Claude Opus 4.5,代理能力全面升級

這波密集發布潮發生在DeepSeek引發全球關注的一週年之際,顯示中國AI產業已經從「追趕者」轉變為「挑戰者」,在多個細分領域展現出與美國頂級企業正面競爭的實力。

2026年2月中國AI模型發布潮

  • 共同特徵:開源或低成本策略,直接挑戰美國頂級閉源模型
  • 涵蓋領域:語言模型(GLM-5、M2.5)、視頻生成(Seedance)、通用助手(Qwen)
  • 策略轉變:從價格戰轉向性能戰,在基準測試上直接與西方模型對標
  • 市場影響:相關企業股價普遍上漲,投資者信心增強

開源策略的深層意義

GLM-5選擇開源發布具有多重戰略意義。首先,開源降低了全球開發者的使用門檻,有助於建立圍繞GLM生態的開發者社區。其次,開源是對西方閉源模型(如Claude Opus 4.5和GPT-5.2)的直接挑戰——當一個免費開源的模型能提供接近的性能時,開發者和企業將不得不重新審視是否值得為閉源API支付高額費用。

更重要的是,開源策略反映了中國AI企業在全球化佈局上的深謀遠慮。與Meta的Llama系列類似,智譜希望通過開源讓GLM成為全球開發者的默認選擇之一,從而在AI生態系統的底層建立影響力。這種策略的長期回報——品牌認知、人才吸引、數據回饋——可能遠超短期的商業收入。

性能宣稱需要審慎看待

在為GLM-5的成就喝彩的同時,我們也需要保持理性。CNBC在報導中明確指出,智譜關於GLM-5性能的宣稱「未能得到獨立驗證」。這在AI領域並非新鮮事——過去一年中,多家企業的基準測試成績在獨立評測中被發現存在差距。

AI基準測試本身也存在局限性。SWE-Bench等測試雖然提供了有價值的參考指標,但它們無法完全反映模型在真實世界任務中的表現。企業在選擇AI模型時,應該結合自身的具體應用場景進行實際測試,而不是僅僅依賴基準測試分數。

對全球AI格局的影響

GLM-5的發布進一步印證了Google DeepMind CEO Demis Hassabis的判斷——中國AI模型與西方頂級模型之間的差距「只有幾個月」。在2026年初的這波攻勢之後,AI產業的全球競爭格局正在發生根本性的變化。

對於Anthropic和OpenAI而言,來自中國的開源挑戰不僅是性能上的壓力,更是商業模式上的威脅。當免費的開源模型能夠在關鍵任務上提供「足夠好」的表現時,閉源模型必須在安全性、可靠性、企業服務和生態系統整合等方面提供不可替代的價值,才能維持其定價能力。

2026年的AI競爭已經不再是簡單的「誰的模型更大」或「誰的分數更高」的較量。它正在演變為一場涉及技術路線、商業模式、開源策略和地緣政治的多維博弈。GLM-5的開源發布,是這場博弈中的重要一步。