Anthropic 意外洩露「Claude Mythos」:能力凌駕 Opus 的全新模型,引發網路安全恐慌

Anthropic accidentally leaks 'Claude Mythos' model details: step-change performance, unprecedented cybersecurity risks

Anthropic 因內容管理系統的設定錯誤,意外將近 3,000 份未發布資產短暫公開,包含一篇詳細描述其下一代旗艦模型 Claude Mythos(內部代號亦稱「Capybara」)的草稿部落格文章。《財富》雜誌記者率先發現該洩漏並通知 Anthropic,公司隨即限制了公開存取。

「劃時代的跨越」:超越 Opus 的全新模型層級

根據洩漏的草稿,Mythos 代表一個全新的模型等級,位階高於現有旗艦 Opus 系列:

「Capybara 是一個全新的模型名稱,代表一個全新的等級——比我們的 Opus 模型更大、更智慧,而後者迄今仍是我們最強大的。」

草稿指出,與 Claude Opus 4.6 相比,新模型在軟體程式編寫、學術推理與網路安全等多項測試中取得「顯著更高的分數」。Anthropic 發言人確認,該模型目前正由「少數早期存取客戶」進行測試。

兩個名字,同一個模型

洩漏文件中出現兩個版本的草稿:「Mythos」(v1)與「Capybara」(v2),內容幾乎相同,僅名稱不同。外界分析認為:「Capybara」是內部層級代號,「Mythos」是對外公開的模型名稱,Anthropic 仍在兩者之間做最終決定。

最大隱憂:前所未有的網路安全能力

洩漏文件中,最令外界震驚的是關於網路安全風險的坦白警告。文件指出,Mythos「目前在網路能力上遠超其他所有 AI 模型」,能夠快速識別並利用軟體漏洞——速度超越人類防禦者。

文件更預警,Mythos「預示著一波即將到來的模型浪潮,這些模型的漏洞利用能力將遠超防禦端的努力」。這段話引發資安業界的強烈反應,網路安全類股在消息曝光後單日下跌。

成本高昂,推廣節奏審慎

草稿坦言,Mythos「對我們而言服務成本極高,對客戶使用成本同樣極高」,Anthropic 正努力在全面開放前大幅提升其效率。這意味著 Mythos 短期內不會像 Claude Opus 4.6 一樣廣泛上線,預計將維持精選客戶的付費存取模式。

這次洩漏事件也讓外界得以窺見 AI 頂尖實驗室在發布前景描述的語言尺度——「步入一個新紀元」的措辭幾乎毫無保留地出現在了本不應公開的內部草稿中。