技術突破

GPT-5.2震撼發布：首個突破90% ARC-AGI的AI模型，重新定義人工智能能力邊界

📅 2026年1月28日 ✍️ AI Academy HK 編輯部 ⏱️ 閱讀時間：8分鐘

🚀

OpenAI於2025年12月11日正式發布GPT-5.2，這款被譽為「改變遊戲規則」的人工智能模型，不僅在多項基準測試中創下歷史紀錄，更成為首個在ARC-AGI測試中突破90%準確率的AI系統。這一里程碑式的突破，標誌著人工智能正以前所未有的速度逼近通用人工智能（AGI）的門檻。

90%+

ARC-AGI準確率

100%

AIME 2025得分

400K

上下文視窗

70.9%

超越人類專家

突破性能力：重新定義AI的可能性

GPT-5.2的發布並非漸進式的改良，而是一次質的飛躍。根據OpenAI官方公布的數據，這款模型在GDPval任務中以70.9%的準確率超越人類專家，而且速度是人類的11倍，成本不到人類的1%。這意味著，在專業知識工作領域，AI已經具備了取代或大幅增強人類能力的潛力。

最令業界震驚的是GPT-5.2在ARC-AGI測試中的表現。ARC-AGI（抽象推理語料庫）被公認為衡量AI通用智能的「黃金標準」，因為它測試的是AI在從未見過的任務中進行抽象推理的能力——這正是此前AI系統最薄弱的環節。GPT-5.2首次突破90%的門檻，意味著AI在「舉一反三」的能力上取得了重大進展。

                🎯 GPT-5.2三大版本
                GPT-5.2-Instant：快速日常助手，適合工作和學習的日常任務
GPT-5.2-Thinking：深度思考版本，專為編程、規劃等複雜工作設計
GPT-5.2-Pro：最智能選項，適用於質量比速度更重要的困難問題

            

技術規格：400K上下文與128K輸出

GPT-5.2採用了革新性的架構設計，支援高達400K tokens的上下文視窗和128K tokens的輸出長度。這意味著用戶可以一次性輸入相當於一本中等長度小說的內容，並獲得詳盡的分析和回應。對於需要處理大量文檔的法律、金融和研究領域，這一改進具有革命性的意義。

在數學推理方面，GPT-5.2在AIME 2025測試中達到了100%的完美得分，在FrontierMath測試中則達到40.3%，較前代GPT-5.1提升了10個百分點。這些成績表明，AI在處理高度複雜的數學問題時已經達到了頂尖數學家的水平。

GPT-5.2-Codex：代理式編程的新標準

伴隨GPT-5.2一同發布的還有GPT-5.2-Codex，這是OpenAI迄今為止最先進的代理式編程模型。與傳統的程式碼輔助工具不同，GPT-5.2-Codex能夠自主理解複雜的軟體工程任務，規劃執行步驟，並獨立完成從需求分析到程式碼實現的整個流程。

「GPT-5.2-Codex具有我們迄今發布的任何模型中最強大的網絡安全能力。然而，這些進步也帶來了新的雙重用途風險，需要謹慎部署。」

值得注意的是，OpenAI在公告中特別強調了GPT-5.2-Codex的安全考量。該模型在增強網絡安全防禦能力的同時，也可能被惡意行為者利用。OpenAI表示已實施多層安全措施，並將持續監控模型的使用情況。

舊時代的終結：GPT-4o即將退役

隨著GPT-5.2的成功，OpenAI宣布將於2026年2月13日正式退役包括GPT-4o、GPT-4.1、GPT-5（Instant和Thinking版本）在內的多款舊模型。根據官方數據，目前每天只有0.1%的用戶仍在使用GPT-4o，絕大多數使用量已經轉移到GPT-5.2。

OpenAI CEO Sam Altman此前承認，公司低估了部分用戶對GPT-4o的情感依戀，特別是在過渡到GPT-5的過程中。儘管如此，OpenAI表示這一決定經過慎重考慮，退役舊模型有助於集中資源進行更前沿的研究。

對香港企業的啟示

對於香港的企業而言，GPT-5.2的發布帶來了巨大的機遇與挑戰。一方面，企業可以利用更強大的AI能力提升生產效率、優化客戶服務、加速產品開發。特別是金融服務業、法律行業和專業服務領域，GPT-5.2的長上下文能力和專業推理能力可以大幅提升工作效率。

另一方面，企業也需要重新評估其AI策略。隨著AI能力的快速演進，過去的部署方案可能很快變得過時。建議企業採取靈活的AI採用策略，密切關注技術發展，並建立內部AI能力評估機制。

展望未來：AGI還有多遠？

GPT-5.2在ARC-AGI測試中的突破性表現引發了業界對AGI時間表的重新評估。雖然90%的準確率仍意味著存在10%的失敗案例，但這一進步的速度令人矚目。如果按照目前的發展軌跡，下一代模型很可能在2026年底或2027年初進一步縮小與人類通用智能的差距。

然而，也有研究者指出，ARC-AGI測試雖然重要，但並不能完全代表通用智能。真正的AGI需要具備在任意開放環境中學習、適應和創新的能力，而這仍然是當前AI系統的根本挑戰。無論如何，GPT-5.2的發布無疑標誌著我們正處於AI發展史上最激動人心的時刻。

GPT-5.2 OpenAI ARC-AGI 大語言模型人工智能 AGI

突破性能力：重新定義AI的可能性

🎯 GPT-5.2三大版本

技術規格：400K上下文與128K輸出

GPT-5.2-Codex：代理式編程的新標準

舊時代的終結：GPT-4o即將退役

對香港企業的啟示

展望未來：AGI還有多遠？

📖 相關文章

Claude Cowork：AI成為你的工作夥伴

AI Agent元年：自主AI系統爆發式增長

Gemini 3代理視覺：AI學會「主動觀察」