OpenAIがネイティブのコンピュータ使用機能を備えたGPT-5.5 AIモデルをリリース

CryptoFrontier

OpenAIは2026年4月23日に、ネイティブなコンピュータ利用能力を通じて現実のアプリケーションにおけるユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を公式にリリースしました。OpenAIの発表によると、このモデルは汎用的なネイティブ機能を備えており、デスクトップアプリケーションをナビゲートしたり、ボタンをクリックしたり、マルチステップのワークフローのためにテキストを入力したりできます。

GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせており、自律的に高レベルのプロフェッショナルなタスクに必要なソフトウェアツールをナビゲートします。このモデルの約110万トークンのコンテキストウィンドウにより、以前は手作業でのチャンク分割が必要だった大量の金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って、24,771件のK-1税務フォーム (71,637ページ) をレビューし、前年度より2週間早くタスクを完了しました。

パフォーマンス評価ベンチマーク

GPT-5.5は、社内の投資銀行業務モデリングタスクで88.5%、FinancialAgent v1.1ベンチマークで60%を達成し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を獲得しました。これは44の職業にまたがる具体的な知的作業をエージェントが生み出す能力をテストするものです。OSWorld-Verified(モデルの自律的な実コンピュータ操作を測定)では78.7%に到達しました。GPT-5.5はTau2-bench Telecomで98%をスコアしました。これは非常に難しいカスタマーサービスのワークフローをテストします。

Go-to-Marketチームの社員は、週次のビジネスレポートを自動化すれば、毎週の手作業をおおよそ5〜10時間削減できると確認しました。

コード生成とシステム最適化

OpenAIは、GPT-5.5が自身のサービング基盤のコード作成に役立てられたと報告しています。このモデルは、プロダクショントラフィックのパターンを分析して独自の負荷分散のヒューリスティックを作成することで「システムレベル最適化」を達成し、自身のトークン生成速度を20%向上させました。

開発者向けのテストで、このモデルは「markdownエディタを再アーキテクチャせよ」と求められ、最小限の人間による修正で、ほぼ完成した12-diffスタックを返しました。OpenAIは、新しいモデルがより少ないターンで正しい回答に到達し、GPT-5.4と比べて同じCodexタスクではトークンを40%少なく使用すると述べています。

Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「『概念の明確さ』を持つ最初のコーディングモデル」として説明しました。Shipperは、彼自身と最良のエンジニアがアプリでポストローンチの問題のデバッグに数日を費やした後にGPT-5.5を試験しました。Shipperによると、GPT-5.5はGPT-5.4ができなかったことを達成しました。つまり、壊れたコードを調べ、エンジニアが最終的に採用した書き直し案を生成したのです。このモデルは、場所を失うことなく、情報のライブラリ全体を「記憶」し照合でき、以前のバージョンで悩まされた「幻覚」を減らします。

自律的な能力と自己修正

OpenAIは、GPT-5.5が「自己修正」と自律性のために最適化されていると主張しています。このモデルは曖昧な指示を解釈し、目的を達成するために人間の介入なしで (clicking, typing, browsing) を含むコンピュータ・インターフェースを活用することに優れています。エージェントがソフトウェアを操作し、端末中心のワークフローを管理し、また (500K+ tokens) にわたってコードベース全体を推論する必要がある場合に、特に有用になります。高いリトリーバル精度でこれを実現します。

GPT-5.5 Thinking機能

ChatGPTにおいて、OpenAIは「GPT-5.5 Thinking」を導入しました。同社によれば、これはより難しい問題に対して迅速な支援を可能にします。この機能は、複雑なタスクをより効率的に完了できるようにするため、より賢く、より簡潔な回答を提供します。特に、プラグインを使用する際に、情報の統合と分析、コーディング、調査などのドキュメント量の多いタスクといったプロフェッショナルな作業に強みがあります。

初期のGPT-5.5 Proテスターは、ChatGPTが取り組める仕事の品質と難易度の両面で大幅な改善があったと報告しています。その低レイテンシは、GPT-5.4 Proよりも要求の厳しいタスクで現実的です。GPT-5.5 Proの応答は、よく構造化されており、関連性が高く、有用で、正確です。特に法律、データサイエンス、ビジネス、教育でのパフォーマンスが際立っています。

価格と利用可能性

基本版は利用可能ですが、最も高性能なバージョン (GPT-5.5 Pro) は個人の加入者に対して月額$100です。企業向けには、出力トークンあたりのコストはGPT-5.4の約2倍ですが、トークン効率が40%高いにもかかわらずです。大規模なエージェント型導入の全体コストは相当なものになり得ます。最上位の推論が、資金の潤沢な企業だけが利用できる「贅沢(ラグジュアリー)」になるのではないかという懸念が高まっており、大企業と小規模なスタートアップの間で生産性格差が拡大する可能性があります。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
AprDaydreamvip
· 3時間前
希望公式提供一个可审计的行动日志/回放机制,否则出现问题时很难追责,尤其是自动操作资产类账户。
原文表示返信0
PaperHandsProvip
· 3時間前
現実の応用における「意図の理解」こそが難点であり、もう二度とあなたが航空券を予約したいのに履歴書を修正されるという恥ずかしい事態が起きないことを願います。
原文表示返信0
Half-SectionedSucculentvip
· 3時間前
少し期待している一方で、少し怖い:マウスをクリックできることは、多くの「人間のクリック」でしかできないことができることと同じであり、リスク管理と反不正行為対策の強化が必要になる。
原文表示返信0
ACalmnessWithAHintOfPomelovip
· 3時間前
この波はWeb3にも影響を与えるでしょう。自動化されたオンチェーン操作、署名プロセス、ウォレットのインタラクションがシームレスに行えるようになれば、製品の形態は変わるでしょう。
原文表示返信0
StarsInTheGlassDomevip
· 3時間前
APIと価格は急がず、まず複雑なデスクトップ環境でポップアップ、マルチウィンドウ、ネットワークのジッターに耐えられるかどうかを見てみましょう。
原文表示返信0
GateUser-b665e41cvip
· 3時間前
「話せて書ける」から「できて納品できる」へ進化するのを感じている。次のステップは、より良い記憶とタスク管理を提供することだ。
原文表示返信0
LintCollectorvip
· 3時間前
もし本当にアプリ間の連携が可能になれば:ブラウザで資料を検索→Excelで処理→PPTでプレゼン資料作成→メールで送信、これがオフィスの全工程のクローズド・ループとなる。
原文表示返信0
DegenWithNotebookvip
· 3時間前
ついにデスクトップネイティブ操作が登場したのか?これで本当に「デジタルインターン生」になるぞ。
原文表示返信0