技術突破

GPT-5.2震撼發布:首個突破90% ARC-AGI的AI模型,重新定義人工智能能力邊界

📅 2026年1月28日 ✍️ AI Academy HK 編輯部 ⏱️ 閱讀時間:8分鐘

OpenAI於2025年12月11日正式發布GPT-5.2,這款被譽為「改變遊戲規則」的人工智能模型,不僅在多項基準測試中創下歷史紀錄,更成為首個在ARC-AGI測試中突破90%準確率的AI系統。這一里程碑式的突破,標誌著人工智能正以前所未有的速度逼近通用人工智能(AGI)的門檻。

90%+
ARC-AGI準確率
100%
AIME 2025得分
400K
上下文視窗
70.9%
超越人類專家

突破性能力:重新定義AI的可能性

GPT-5.2的發布並非漸進式的改良,而是一次質的飛躍。根據OpenAI官方公布的數據,這款模型在GDPval任務中以70.9%的準確率超越人類專家,而且速度是人類的11倍,成本不到人類的1%。這意味著,在專業知識工作領域,AI已經具備了取代或大幅增強人類能力的潛力。

最令業界震驚的是GPT-5.2在ARC-AGI測試中的表現。ARC-AGI(抽象推理語料庫)被公認為衡量AI通用智能的「黃金標準」,因為它測試的是AI在從未見過的任務中進行抽象推理的能力——這正是此前AI系統最薄弱的環節。GPT-5.2首次突破90%的門檻,意味著AI在「舉一反三」的能力上取得了重大進展。

🎯 GPT-5.2三大版本

  • GPT-5.2-Instant:快速日常助手,適合工作和學習的日常任務
  • GPT-5.2-Thinking:深度思考版本,專為編程、規劃等複雜工作設計
  • GPT-5.2-Pro:最智能選項,適用於質量比速度更重要的困難問題

技術規格:400K上下文與128K輸出

GPT-5.2採用了革新性的架構設計,支援高達400K tokens的上下文視窗和128K tokens的輸出長度。這意味著用戶可以一次性輸入相當於一本中等長度小說的內容,並獲得詳盡的分析和回應。對於需要處理大量文檔的法律、金融和研究領域,這一改進具有革命性的意義。

在數學推理方面,GPT-5.2在AIME 2025測試中達到了100%的完美得分,在FrontierMath測試中則達到40.3%,較前代GPT-5.1提升了10個百分點。這些成績表明,AI在處理高度複雜的數學問題時已經達到了頂尖數學家的水平。

GPT-5.2-Codex:代理式編程的新標準

伴隨GPT-5.2一同發布的還有GPT-5.2-Codex,這是OpenAI迄今為止最先進的代理式編程模型。與傳統的程式碼輔助工具不同,GPT-5.2-Codex能夠自主理解複雜的軟體工程任務,規劃執行步驟,並獨立完成從需求分析到程式碼實現的整個流程。

「GPT-5.2-Codex具有我們迄今發布的任何模型中最強大的網絡安全能力。然而,這些進步也帶來了新的雙重用途風險,需要謹慎部署。」

值得注意的是,OpenAI在公告中特別強調了GPT-5.2-Codex的安全考量。該模型在增強網絡安全防禦能力的同時,也可能被惡意行為者利用。OpenAI表示已實施多層安全措施,並將持續監控模型的使用情況。

舊時代的終結:GPT-4o即將退役

隨著GPT-5.2的成功,OpenAI宣布將於2026年2月13日正式退役包括GPT-4o、GPT-4.1、GPT-5(Instant和Thinking版本)在內的多款舊模型。根據官方數據,目前每天只有0.1%的用戶仍在使用GPT-4o,絕大多數使用量已經轉移到GPT-5.2。

OpenAI CEO Sam Altman此前承認,公司低估了部分用戶對GPT-4o的情感依戀,特別是在過渡到GPT-5的過程中。儘管如此,OpenAI表示這一決定經過慎重考慮,退役舊模型有助於集中資源進行更前沿的研究。

對香港企業的啟示

對於香港的企業而言,GPT-5.2的發布帶來了巨大的機遇與挑戰。一方面,企業可以利用更強大的AI能力提升生產效率、優化客戶服務、加速產品開發。特別是金融服務業、法律行業和專業服務領域,GPT-5.2的長上下文能力和專業推理能力可以大幅提升工作效率。

另一方面,企業也需要重新評估其AI策略。隨著AI能力的快速演進,過去的部署方案可能很快變得過時。建議企業採取靈活的AI採用策略,密切關注技術發展,並建立內部AI能力評估機制。

展望未來:AGI還有多遠?

GPT-5.2在ARC-AGI測試中的突破性表現引發了業界對AGI時間表的重新評估。雖然90%的準確率仍意味著存在10%的失敗案例,但這一進步的速度令人矚目。如果按照目前的發展軌跡,下一代模型很可能在2026年底或2027年初進一步縮小與人類通用智能的差距。

然而,也有研究者指出,ARC-AGI測試雖然重要,但並不能完全代表通用智能。真正的AGI需要具備在任意開放環境中學習、適應和創新的能力,而這仍然是當前AI系統的根本挑戰。無論如何,GPT-5.2的發布無疑標誌著我們正處於AI發展史上最激動人心的時刻。

GPT-5.2 OpenAI ARC-AGI 大語言模型 人工智能 AGI