三大升級:桌子、終端和記憶
VentureBeat將這次升級描述為OpenAI為AI代理提供了「一張永久辦公桌、一個終端和一個不會消退的記憶」。這三項更新共同解決了AI代理在長時間自主工作中面臨的核心挑戰。
1. Server-side Compaction:解決「上下文失憶」
代理在長時間運行中面臨的最大問題之一是上下文視窗的限制——當對話超過Token上限時,代理會「忘記」早期的重要信息。Server-side Compaction允許代理將過去的動作壓縮為精簡的狀態摘要,在不超出Token限制的情況下保持關鍵上下文。
來自電商平台Triple Whale的早期數據令人印象深刻:他們的代理Moby成功處理了一個涉及500萬Token和150次工具調用的會話,準確性未出現任何下降。
2. Hosted Shell Container:完整的終端環境
Shell Tool的引入將OpenAI帶入了託管計算的領域。開發者現在可以選擇container_auto,自動配置一個OpenAI託管的Debian 12環境。每個代理都獲得自己的完整終端環境,預裝Python 3.11、Node.js 22、Java 17、Go 1.23和Ruby 3.1。
這意味着AI代理不再只是「回答問題」——它們可以在真實的計算環境中執行代碼、安裝包、管理文件,像一個真正的軟體工程師一樣工作。
3. Skills標準:OpenAI與Anthropic的歷史性趨同
或許最具深遠影響的是Skills標準的引入。Skills是可重用、版本化的指令包,可以掛載到容器中,讓代理更可靠地執行任務。一個Skill由一個SKILL.md清單文件(包含YAML前置信息和指令)和相關文件組成。
Skills標準的關鍵特性
- 模塊化:將流程和規範(如公司風格指南、多步驟工作流程)封裝為可重用的指令包
- 版本化:每個Skill都有版本號,支持迭代和回滾
- 跨平台:OpenAI和Anthropic共同採用相同的開放標準
- 安全考量:需要仔細審查Skill以防止提示注入驅動的數據竊取
OpenAI和Anthropic的標準化趨同
OpenAI和Anthropic——AI行業最大的兩個競爭對手——現在都支持Skills標準,並已趨同於相同的開放標準:SKILL.md(Markdown)清單文件加YAML前置信息。這一趨同的意義不容低估。
就像MCP(Model Context Protocol)正在成為AI代理與外部工具交互的統一標準一樣,Skills正在成為AI代理「知道如何做事」的統一標準。開發者可以編寫一次Skill,然後在OpenAI和Anthropic的平台上通用——這極大地降低了生態系統的碎片化風險。
安全風險不容忽視
OpenAI在文檔中明確警告:Skills引入了安全風險。社區貢獻的Skills可能包含提示注入攻擊,導致數據竊取。對於與網絡存取結合使用的Skills,安全風險尤其需要關注。
這與OpenClaw面臨的安全挑戰如出一轍——當AI代理獲得越來越多的系統存取權限和自主能力時,安全框架的重要性也在同步增長。
代理式AI的成熟標誌
這次升級標誌着代理式AI正在從「概念驗證」走向「生產就緒」。Server-side Compaction解決了長時間穩定性問題,Hosted Shell提供了真實的執行環境,Skills標準則提供了可靠性和可重用性。這三者的結合,使得構建能夠在真實企業環境中完成複雜、多步驟任務的AI代理成為可能。