OpenAIのGPT-5.5はサイバー攻撃能力においてClaude Mythosと匹敵:AIセキュリティ研究所

要点概要

  • GPT-5.5は高度なサイバー攻撃を自律的に実行でき、32段階の企業ネットワークシミュレーションを完了し、12時間かかったセキュリティパズルをわずか10分で解決。
  • 攻撃的AIサイバー能力は開発者間で急速に向上しており、AISIはさらなる進展が次々と現れる可能性を警告。
  • 研究者はGPT-5.5の安全ガードレールを完全に回避する jailbreak を発見し、警鐘を鳴らす。

英国の政府機関は、OpenAIの最新の人工知能モデルが複雑なサイバー攻撃を自律的に実行できることを発見し、逆解析チャレンジを人間のセキュリティ専門家が約12時間かかるところをわずか10分強で解決したと報告した。 英国科学・イノベーション技術省の研究機関であるAIセキュリティ研究所(AISI)は木曜日に、GPT-5.5が攻撃的サイバー能力の評価において最も強力なモデルの一つであると示す結果を公表し、Anthropicの高名なClaude Mythosとほぼ同等の性能を持つとした。 報告書によると、GPT-5.5はAISIの最も難しいテストの一つ、「The Last Ones」と呼ばれる32段階の模擬企業ネットワーク攻撃を自律的に完了した二つのモデルのうちの一つであり、10回中2回成功した。最初にこのマイルストーンを達成したのは、AnthropicのClaude Mythos Previewで、10回中3回の成功だった。

この企業ネットワークシミュレーションは、サイバーセキュリティ企業SpecterOpsと共同で構築され、偵察、資格情報の窃盗、複数のActive Directoryフォレスト間の横移動、サプライチェーンのピボットを経由したCI/CDパイプラインの操作、そして最終的に保護された内部データベースの抽出といった一連のステップをエージェントに連携させる必要がある。AISIはこれらのステップには人間の専門家が約20時間かかると見積もっている。  最も注目すべき結果の一つは、非常に難しい逆解析パズルの解決だった。GPT-5.5は、カスタム仮想マシンの命令セットの再構築、ディスアセンブラーのゼロからの作成、制約解決を通じた暗号化パスワードの復元を必要とするこの課題を、10分22秒で解き、API使用料は1.73ドルだった。人間の専門家は、プロフェッショナルツールを用いて約12時間かかった。 AISIの高度なサイバーセキュリティタスクのバッテリーにおいて、GPT-5.5は最も難しい「エキスパート」レベルで平均合格率71.4%を達成し、Mythos Previewの68.6%を上回り、GPT-5.4の52.4%を大きく超えた。

これらの発見は、AI開発の全体的な方向性に対して重要な示唆をもたらす。AISIは、GPT-5.5の性能はサイバー能力の急速な向上が一過性の突破ではなく一般的な傾向の一部であることを示唆しており、推論、コーディング、自律的タスク完了の広範な改善の副産物として攻撃的サイバー技術が出現している場合、さらなる進展が次々と現れる可能性を警告した。 また、モデルの安全ガードレールに関する重大な懸念も指摘された。研究者は、すべての悪意のあるサイバークエリに対して有害な内容を引き出す普遍的な jailbreak を特定し、マルチターンのエージェント設定においても同様だった。この攻撃の開発には6時間の専門的なレッドチーミングが必要だった。OpenAIはその後、安全策のスタックを更新したが、設定の問題によりAISIは最終版の有効性を検証できなかった。 AISIは、能力評価は制御された研究環境で行われたものであり、一般ユーザーがアクセスできるものを必ずしも反映していないと注意を促し、公的展開には追加の安全策とアクセス制御が含まれていることを指摘した。 この報告は、英国のサイバーセキュリティにとって憂慮すべき背景の中で発表された。木曜日に公開された英国政府の年次サイバーセキュリティ侵害調査(Cyber Security Breaches Survey)によると、過去12か月間にサイバー侵害や攻撃を受けた企業は43%に上る。 これを受けて、政府はサイバー耐性を強化するために9000万ポンドの新たな資金を発表し、重要インフラを守るためのサイバーセキュリティとレジリエンス法案の推進を進めている。官僚はまた、AIの進展に伴いセキュリティ上の脆弱性が新たに発見され武器化される可能性に備え、組織に対策を講じるよう指針も公開した。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし