3月6日消息,OpenAI 在萨姆·奥特曼领导下发布最新 AI 模型 GPT-5.4,已在 ChatGPT、API 及 Codex 中上线,同时提供性能更高的 GPT-5.4 Pro 版本,专为企业和复杂工作负载设计。
GPT-5.4 将高級推理與編碼功能深度整合,支持電子表格、演示文稿及結構化數據任務,並可在 ChatGPT 中預規劃推理流程,顯著提升效率。該模型提供高達一百萬詞元的上下文窗口,並在 API 中移除 beta 標籤,實現更穩定的企業應用體驗。Codex 版本也支持擴展詞元窗口,但超過 272,000 詞元的請求將按雙倍使用率計費。
新版本引入原生計算機使用功能,AI 代理可通過鍵盤和鼠標與操作系統、網站及應用程序交互,實現跨工具的自動化多步驟工作流程。同時,“工具搜索”功能使模型動態選擇外部工具,無需全部加載到內存,減少複雜環境下的詞元消耗。OpenAI 稱 GPT-5.4 的回應錯誤率較 GPT-5.2 降低 18%,單條聲明虛假可能性下降 33%,提升了整體推理精度與詞元效率。
在專業基準測試中,GPT-5.4 的 GDPval 得分為 83%,超過多項行業專業水平;FrontierMath 測試中,Pro 版本在高級數學問題得分 38%,優於 Thinking 版本 27.1%;SWE-Bench Pro 編程測試也顯示其領先優勢。內部評分顯示,在 68% 的情況下,評審員更傾向於 GPT-5.4 輸出結果,並在模擬銀行工作流程的電子表格任務中獲得 87.5% 分數。
GPT-5.4 提供 Thinking 與 Pro 兩個版本,定價分別為每百萬輸入令牌 2.5 美元/輸出 15 美元,以及每百萬輸入令牌 30 美元/輸出 180 美元,Pro 版本面向企業用戶。開發者可通過 API 使用 GPT-5.4 和 GPT-5.3 Pro,進一步擴展 OpenAI 在消費者及企業平台的 AI 基礎設施,助力專業級任務自動化和高效處理。