據 1M AI News 監測,Anthropic 正在測試一款名為「Claude Mythos」的新模型,因內容管理系統配置失誤,一份未發布的博客草稿被存儲在公開可搜索的數據庫中,意外暴露了該模型的存在。Anthropic 隨後確認了這款模型,稱其代表「能力的階躍式提升」(step change),是「我們迄今構建的最強模型」。
洩露的草稿顯示,Mythos 是一個全新的模型層級,定位高於 Opus 系列。草稿稱「與此前最佳模型 Claude Opus 4.6 相比,該模型在軟件編程、學術推理和網絡安全等測試中的得分大幅提升」。草稿中還出現了「Capybara」這一代號,與 Mythos 指向同一底層模型。
Anthropic 對該模型的網絡安全能力尤為警惕,草稿稱其「在網絡安全能力方面目前遠遠領先於任何其他 AI 模型」,並「預示著即將到來的一波模型浪潮,其漏洞利用能力將遠超防禦者的應對速度」。因此,Anthropic 採取了比以往更緩慢的發布策略:首先向少量早期客戶開放,聚焦網絡安全防禦場景,幫助組織在 AI 驅動的攻擊浪潮到來前加固代碼庫。該模型運行成本極高,短期內不會面向公眾開放。
此次洩露源於 Anthropic 外部 CMS 工具的「人為錯誤」,導致近 3000 項未發布資產(包括博客草稿、圖片和 PDF)被公開存儲在未加密的數據庫中。劍橋大學網絡安全研究員 Alexandre Pauwels 和 LayerX Security 高級 AI 安全研究員 Roy Paz 分別獨立發現了這些文件。洩露內容還包括 Anthropic 即將在英國舉辦的歐洲企業 CEO 閉門峰會細節,CEO Dario Amodei 將出席,地點為英國鄉間一座 18 世紀莊園酒店。
Anthropic 發言人表示:「我們正在開發一款通用模型,在推理、編程和網絡安全方面有重大進展。鑑於其能力的強度,我們在發布方式上會非常審慎。」