Anthropic 正在测试它有史以来打造的最强大 AI 模型,而世界本不该这么快就知道。
《财富》(Fortune)周四披露的一起数据泄露事件显示,Claude 背后的 AI 实验室训练了一个名为 “Mythos” 的新模型,该实验室在内部将其描述为“迄今为止我们开发的最强大的 AI 模型”。
据审阅相关材料的网络安全研究人员称,该模型是在一篇草稿博客文章中被发现的:这篇文章被留在一个未加安全保护、可被公众公开检索的数据缓存中,并与近 3,000 份其他未发布资产一同存在。
在《财富》进行询问之后,Anthropic 证实了该模型的存在,并称其为 AI 性能方面的“重大飞跃”,以及“截至目前我们构建过的最有能力的模型”。公司表示,这一模型正由“早期接入客户”进行试用,并承认其内容管理系统中的“人为错误”导致了泄露。
这篇草稿博客文章引入了一个新的模型等级 “Capybara”,其描述为比 Anthropic 现有的 Opus 模型更大、更强大,而 Opus 模型此前一直是它最强的产品。
“与我们之前表现最好的模型 Claude Opus 4.6 相比,Capybara 在软件编码、学术推理、网络安全等测试中取得了显著更高的分数,”草稿写道。
对加密行业而言,最关键的是网络安全这一维度。草稿博客文章称该模型“带来了前所未有的网络安全风险”,这种表述将直接影响区块链安全、智能合约审计,以及 DeFi 中攻击者与防御者之间不断升级的军备竞赛。
仅就本周而言,Ripple 已宣布针对 XRP Ledger 的 AI 驱动安全彻底改造,此前一支借助 AI 的红队在其 13 年的代码库中发现了 10 多处漏洞。以太坊还推出了一个专门的后量子安全枢纽,并由八年的研究作为支撑。
此外,Resolv 稳定币在攻击者利用一个不做预言机检查且使用单密钥访问控制的铸币合约后脱锚——这类基础设施失灵,可能正是更强大的 AI 工具在攻击者之前识别出来的,或至少比防御者更快地发现与利用的那种情况。
对于 AI 代币市场,此次泄露引发的是另一个问题。Bittensor 的去中心化网络近日发布了 Covenant-72B——这是一种与 Meta 的 Llama 2 70B 竞争的模型,从而在 TAO 上触发了 90% 的上涨,并带动子网代币实现合计 14.7 亿美元的市值。
像 Anthropic 这样的中心化实验室所带来的“一步跨越”,会重置去中心化 AI 项目需要达到的基准。由资金雄厚的企业实验室所能构建的能力,与由无需许可的网络所能产出的能力之间的竞争距离,刚刚被拉得更远了。
Anthropic 表示,鉴于该模型的能力,它“正在对发布保持谨慎”。草稿注意到,该模型运行成本高昂,且目前尚未准备好面向一般可用性。该公司在《财富》与其联系后,已移除对该数据缓存的公开访问。
泄露本身就是它自身的警示故事:一家声称其构建的是具备前所未有网络安全能力的 AI 模型的公司,却由于人为错误,仍然把该模型的公告留在了一个未加安全保护、可被公众公开检索的数据存储中。这个反讽无需赘述。