OpenAIは2026年4月23日に、ネイティブなコンピュータ利用能力を通じて現実のアプリケーションにおけるユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を公式にリリースしました。OpenAIの発表によると、このモデルは汎用的なネイティブ機能を備えており、デスクトップアプリケーションをナビゲートしたり、ボタンをクリックしたり、マルチステップのワークフローのためにテキストを入力したりできます。
GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせており、自律的に高レベルのプロフェッショナルなタスクに必要なソフトウェアツールをナビゲートします。このモデルの約110万トークンのコンテキストウィンドウにより、以前は手作業でのチャンク分割が必要だった大量の金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って、24,771件のK-1税務フォーム (71,637ページ) をレビューし、前年度より2週間早くタスクを完了しました。
GPT-5.5は、社内の投資銀行業務モデリングタスクで88.5%、FinancialAgent v1.1ベンチマークで60%を達成し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を獲得しました。これは44の職業にまたがる具体的な知的作業をエージェントが生み出す能力をテストするものです。OSWorld-Verified(モデルの自律的な実コンピュータ操作を測定)では78.7%に到達しました。GPT-5.5はTau2-bench Telecomで98%をスコアしました。これは非常に難しいカスタマーサービスのワークフローをテストします。
Go-to-Marketチームの社員は、週次のビジネスレポートを自動化すれば、毎週の手作業をおおよそ5〜10時間削減できると確認しました。
OpenAIは、GPT-5.5が自身のサービング基盤のコード作成に役立てられたと報告しています。このモデルは、プロダクショントラフィックのパターンを分析して独自の負荷分散のヒューリスティックを作成することで「システムレベル最適化」を達成し、自身のトークン生成速度を20%向上させました。
開発者向けのテストで、このモデルは「markdownエディタを再アーキテクチャせよ」と求められ、最小限の人間による修正で、ほぼ完成した12-diffスタックを返しました。OpenAIは、新しいモデルがより少ないターンで正しい回答に到達し、GPT-5.4と比べて同じCodexタスクではトークンを40%少なく使用すると述べています。
Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「『概念の明確さ』を持つ最初のコーディングモデル」として説明しました。Shipperは、彼自身と最良のエンジニアがアプリでポストローンチの問題のデバッグに数日を費やした後にGPT-5.5を試験しました。Shipperによると、GPT-5.5はGPT-5.4ができなかったことを達成しました。つまり、壊れたコードを調べ、エンジニアが最終的に採用した書き直し案を生成したのです。このモデルは、場所を失うことなく、情報のライブラリ全体を「記憶」し照合でき、以前のバージョンで悩まされた「幻覚」を減らします。
OpenAIは、GPT-5.5が「自己修正」と自律性のために最適化されていると主張しています。このモデルは曖昧な指示を解釈し、目的を達成するために人間の介入なしで (clicking, typing, browsing) を含むコンピュータ・インターフェースを活用することに優れています。エージェントがソフトウェアを操作し、端末中心のワークフローを管理し、また (500K+ tokens) にわたってコードベース全体を推論する必要がある場合に、特に有用になります。高いリトリーバル精度でこれを実現します。
ChatGPTにおいて、OpenAIは「GPT-5.5 Thinking」を導入しました。同社によれば、これはより難しい問題に対して迅速な支援を可能にします。この機能は、複雑なタスクをより効率的に完了できるようにするため、より賢く、より簡潔な回答を提供します。特に、プラグインを使用する際に、情報の統合と分析、コーディング、調査などのドキュメント量の多いタスクといったプロフェッショナルな作業に強みがあります。
初期のGPT-5.5 Proテスターは、ChatGPTが取り組める仕事の品質と難易度の両面で大幅な改善があったと報告しています。その低レイテンシは、GPT-5.4 Proよりも要求の厳しいタスクで現実的です。GPT-5.5 Proの応答は、よく構造化されており、関連性が高く、有用で、正確です。特に法律、データサイエンス、ビジネス、教育でのパフォーマンスが際立っています。
基本版は利用可能ですが、最も高性能なバージョン (GPT-5.5 Pro) は個人の加入者に対して月額$100です。企業向けには、出力トークンあたりのコストはGPT-5.4の約2倍ですが、トークン効率が40%高いにもかかわらずです。大規模なエージェント型導入の全体コストは相当なものになり得ます。最上位の推論が、資金の潤沢な企業だけが利用できる「贅沢(ラグジュアリー)」になるのではないかという懸念が高まっており、大企業と小規模なスタートアップの間で生産性格差が拡大する可能性があります。