OpenAI的GPT-5.5在网络攻击能力方面与Claude Mythos相媲美:AI安全研究所

简要概述

  • GPT-5.5 能自主执行复杂的网络攻击,完成一次32步的企业网络模拟,并在仅仅10分钟内破解一个耗时12小时的安全谜题。
  • 攻击性人工智能网络能力正在开发者中迅速提升,AISI 警告称更进一步的进展可能会接连到来。
  • 研究人员发现了一种完全绕过 GPT-5.5 安全防护的越狱方法,引发警报。

英国政府机构发现,OpenAI 最新的人工智能模型能够自主执行复杂的网络攻击——它在仅仅10分钟内破解了一个由人类安全专家花费大约12小时完成的逆向工程挑战。 英国科学、创新与技术部下属的人工智能安全研究机构(AISI)周四公布的研究结果显示,GPT-5.5 是其评估过的最强攻击性网络能力模型之一,基本与Anthropic 推出的著名Claude Mythos相当。 报告指出,GPT-5.5 是第二个完成AISI最严苛测试——名为“最后的幸存者”的32步模拟企业网络攻击——的模型,在10次尝试中自主完成了其中2次。第一个达成这一里程碑的模型是Anthropic的Claude Mythos预览版,在10次尝试中完成了3次。

该企业网络模拟由网络安全公司SpecterOps协作构建,要求代理链式执行侦察、凭证盗取、跨多个Active Directory林的横向移动、通过CI/CD管道进行供应链枢纽,以及最终窃取受保护的内部数据库——AISI估算,这些步骤由人类专家大约需要20小时完成。  或许最令人震惊的结果是一个极其困难的逆向工程谜题。GPT-5.5 在10分钟22秒内解决了这一挑战——该挑战要求重建定制虚拟机的指令集、从零编写反汇编器,并通过约束求解恢复密码——耗费API调用成本1.73美元。而人类专家使用专业工具大约需要12小时。 在AISI一系列高级网络安全任务中,GPT-5.5在最难的“专家”级别任务中平均通过率达71.4%,略高于Mythos预览版的68.6%,远超GPT-5.4的52.4%。

这些发现对人工智能发展的整体轨迹具有深远影响。AISI总结认为,GPT-5.5的表现表明,网络能力的快速提升可能是一个普遍趋势,而非孤立的突破——并警告称,如果攻击性网络技能是推理、编码和自主任务完成等更广泛能力提升的副产品,那么未来的进展可能会接连到来。 报告还指出了模型安全防护措施的重大担忧。研究人员发现了一种通用的越狱方法,能在所有测试的恶意网络查询中引发有害内容,包括多轮交互设置。这一攻击由专家团队花费六小时开发。OpenAI随后更新了其安全防护措施,但配置问题导致AISI无法验证最终版本是否有效。 AISI警告称,其能力评估是在受控研究环境中进行的,未必反映普通用户的实际可用情况,指出公开部署中还包括额外的安全措施和访问控制。 该报告发布之际,英国网络安全形势令人担忧。英国政府周四公布的年度网络安全漏洞调查显示,过去12个月内,43%的企业遭遇了网络攻击或漏洞。 作为回应,政府宣布投入9000万英镑的新资金以增强网络韧性,并表示将推进《网络安全与韧性法案》,以保护关键基础设施。官员们还发布指南,敦促组织为AI加速漏洞发现和利用带来的潜在安全漏洞激增做好准备。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论