Gate 廣場|3/5 今日話題: #比特币创下近一月新高
🎁 解讀行情走勢,抽 5 位錦鯉送出 $2,500 仓位體驗券!
隨著白宮表示已向參議院提交凱文·沃什擔任美聯儲主席的提名,美國參議院未通過叫停特朗普打擊伊朗的投票,比特幣於今日凌晨創下 2 月 5 日以來新高,最高觸及 74,050 美元,加密貨幣總市值回升突破 2.538 萬億美元。
💬 本期熱議:
1️⃣ 凱文·沃什的提名是否意味著降息預期升溫?
2️⃣ 當前關口,你是持幣待漲、順勢追多,還是反手布局回調?
分享觀點,瓜分好禮 👉️ https://www.gate.com/post
📅 3/6 15:00 - 3/8 12:00 (UTC+8)
#OpenAIReleasesGPT-5.4 OpenAI 已正式推出 GPT-5.4,這是其前沿人工智慧模型的最新演進。此次發布標誌著人工智慧能力的一大飛躍,尤其在專業工作、自動化、編碼和大規模推理任務方面。GPT-5.4 現已在 ChatGPT、開發者 API 和 Codex 中推廣,將其定位為目前企業、開發者和知識工作者最先進的 AI 系統之一。
與早期主要專注於對話質量的更新不同,GPT-5.4 專為在軟體工具、文件、試算表和複雜工作流程中執行現實世界任務而設計。該模型整合了推理、編碼、電腦交互和長距離記憶的改進,使其能更高效、更準確地完成多步驟任務。
以下是 GPT-5.4 主要新功能的逐步說明。
1. GPT-5.4 “思考” 模式的引入
其中最引人注目的是 GPT-5.4 思考模式,這是一個專注於推理的模型版本,旨在處理複雜的分析工作。
此模式允許 AI 在生成最終答案前先制定結構化計劃,讓用戶能在回應過程中引導並調整指令。系統不會立即產生文本,而是能更仔細地思考問題,提供更準確的解決方案。
此功能顯著提升以下任務的表現:
策略分析
財務建模
技術解釋
複雜研究問題
多步問題解決
結果是產出更有結構、更準確且目標一致的輸出,並減少後續提示的需求。
2. 巨大語境窗口 (最多100萬個字元)
GPT-5.4 引入史上最大規模的語境窗口之一。
系統能處理高達 100 萬個字元的語境,允許一次分析極大量的信息。
這意味著模型現在可以處理:
整本書
大型財務報告
完整的程式碼庫
多文件研究項目
長時間對話而不失去上下文
與前幾個版本相比,這大大提升了 AI 在複雜工作流程中維持長期記憶的能力。
3. 原生電腦操作能力
首次在 OpenAI 主要模型中,GPT-5.4 包含原生的電腦操作能力。
這意味著 AI 可以像人類用戶一樣與軟體環境互動並執行任務,包括:
控制應用程式
瀏覽網站
使用鍵盤和滑鼠指令
透過截圖與圖形界面互動
在衡量 AI 與電腦系統交互的基準測試中,GPT-5.4 在 OSWorld-Verified 中達到 75% 的成功率,甚至在某些情境中超越平均人類表現。
此能力對於建立能自動化實際工作流程的 AI 代理尤為重要。
4. 與工作場所工具的整合
GPT-5.4 為專業生產力進行了大量優化。
模型現在能更有效地與以下工具協作:
試算表
文件
簡報
開發環境
企業軟體
例如,系統可以生成複雜的 Excel 公式、自動化試算表分析、撰寫報告,甚至在工作流程工具中直接協助簡報製作。
這反映出 AI 正逐步轉變為工作場所的助手,而不僅僅是聊天機器人。
5. 先進的編碼能力
GPT-5.4 結合了強大的編碼能力與更廣泛的推理能力。
開發者現在可以利用模型來:
撰寫和除錯軟體
生成大型程式碼庫
自動化測試與除錯
執行多步驟的程式設計工作流程
在如 SWE-Bench Pro 等高階編碼基準測試中,GPT-5.4 展現出較早版本更強的性能,同時保持更快的回應速度。
這使其成為目前最強大的 AI 編碼助手之一。
6. 複雜工作流程的工具搜尋
另一項重大創新是工具搜尋(Tool Search),允許 GPT-5.4 在任務中動態尋找並使用外部工具。
模型不再在請求開始時載入所有工具定義,而是根據需要搜尋工具。
此方法:
降低字元消耗
加快回應速度
提升在複雜系統中的效率
對於擁有數百個工具的大型企業 AI 環境,這大幅提升了性能與擴展性。
7. 改進的視覺理解
GPT-5.4 亦在視覺感知和圖像理解方面進行了改進。
模型現在能處理高達 1024 萬像素的高解析度圖像,顯著提升以下任務:
文件解析
圖表分析
截圖解讀
用戶界面互動
這些升級使 AI 系統能更有效地處理視覺數據和用戶界面。
8. 主要性能提升
GPT-5.4 在多個 AI 基準測試中取得了顯著進步。
主要結果包括:
在 GDPval(衡量現實世界知識工作任務的基準)中得分 83%
在 SWE-Bench Pro(編碼性能)中得分 57.7%
在 BrowseComp(網路研究任務)中得分 82.7%
在 OSWorld-Verified 電腦使用基準中成功率達 75%
這些結果顯示與早期模型相比有明顯提升。
9. 更佳的字元效率與速度
GPT-5.4 另一項重大改進是字元效率。
模型能用顯著少於前版本的字元來解決複雜任務,從而降低:
計算成本
回應時間
基礎設施負載
這使 GPT-5.4 更加強大且高效,對企業 AI 部署來說是一大優勢。
10. GPT-5.4 Pro 版本
OpenAI 亦推出 GPT-5.4 Pro,一款為高要求計算任務設計的高性能版本。
此版本專為:
大規模自動化
企業工作負載
複雜推理
大量數據處理
而優化。Pro 版本主要面向需要最大 AI 性能的開發者與企業用戶。
這對 AI 的未來意味著什麼
GPT-5.4 的發布反映了 AI 行業的更廣泛轉變。
現代 AI 模型不再僅專注於對話,而是逐步演變成能在軟體系統中完成實際任務的自主數位代理。
具備電腦控制、長距離記憶和工具整合等功能的 GPT-5.4,代表著向能協助複雜專業工作流程與自動化的 AI 系統邁進的一步。
對開發者、企業和研究人員來說,此次更新開啟了在:
AI 驅動的自動化
軟體開發
企業生產力
數據分析
數位研究等領域的新可能性。
簡而言之,#OpenAIReleasesGPT-5.4 標誌著 2026 年最重要的 AI 升級之一,將人工智慧推向更接近成為能處理複雜現實世界任務的強大助手的方向。