OpenAI 發布 GPT-5.4 Mini 和 Nano,可能比大型模型更實用

Decrypt

簡要

  • OpenAI 推出了 GPT-5.4 Mini 和 Nano,兩款為高容量 AI 工作負載設計的更快、更便宜的模型。
  • 這些模型以速度和成本換取了一些準確性,針對重複性和簡單任務,如客戶支援和自動化工作流程。
  • 開發者現在可以運行混合 AI 系統,讓旗艦模型規劃任務,而較小的模型處理大部分工作。

OpenAI 並未放慢腳步。在推出 GPT-5.4 不到兩週後——該模型僅在 GPT-5.3 兩天後發布——該公司於週二又推出了兩款新模型:GPT-5.4 Mini 和 GPT-5.4 Nano。 這些並非旗艦模型的精簡版——它們是專為某些工作而打造的機器,這些工作中等待半分鐘回應不是選項。 OpenAI 稱它們為“迄今為止最具能力的小型模型”,表示 GPT-5.4 Mini 的速度比 GPT-5 Mini 快兩倍以上。如果你曾看過一個編碼助手思考45秒才編輯三行程式碼,你就會理解快速模型的吸引力。

我們推出了 GPT-5.4 mini 和 nano,這是我們迄今為止最具能力的小型模型。

GPT-5.4 mini 的速度是 GPT-5 mini 的兩倍以上。優化於編碼、電腦使用、多模態理解和子代理。

對於較輕量的任務,GPT-5.4 nano 是我們最小且最便宜的…… pic.twitter.com/cdp5HWtM2M

— OpenAI 開發者 (@OpenAIDevs) 2026年3月17日

那麼,為什麼有人會故意發布較不準確的模型呢?簡短的答案:因為準確性並不總是瓶頸。如果你運行一個每天回答200個相同問題的客戶服務聊天機器人,那你不需要在博士級化學考試中得分最高的模型。你需要的是能在一秒內回應、每次回覆成本不到一分的模型。這正是這些模型的設計空間。 但這並不代表這些模型愚蠢或不可靠。在編碼基準測試中,GPT-5.4 Mini 在 SWE-Bench Pro(測量模型修復 GitHub 真實問題能力的測試)中得分54.4%,而舊的 GPT-5 Mini 得分45.7%,完整的 GPT-5.4 則得分57.7%。 在 OSWorld-Verified(測試模型實際操作桌面電腦能力,通過閱讀截圖)中,Mini 達到 72.1%,僅次於旗艦的 75.0%,且都超過人類基線的 72.4%。而 GPT-5.4 Nano 在 SWE-Bench Pro 上得分52.4%,在 OSWorld上得分39.0%,低於 Mini,但仍比之前的 Nano 類模型有大幅提升。

“GPT-5.4 在我們內部評估中,標誌著 Mini 和 Nano 模型的進步,”Perplexity 副 CTO Jerry Ma 在測試後表示。“Mini 提供強大的推理能力,而 Nano 在實時對話工作流程中反應迅速且高效。” 不必將每個任務都路由到昂貴的旗艦模型,你現在可以建立系統,讓大模型規劃和協調,而較小的模型並行處理實際工作——搜尋程式碼庫、閱讀文件或處理表單。如我們在 GPT-5.4 與 Grok 4.20 的比較中所見,模型在工作流程中的位置與選擇哪個模型一樣重要。  GPT-5.4 Mini 透過 API 的收費為每百萬輸入標記 $0.75,每百萬輸出標記 $4.50。GPT-5.4 Nano 更便宜:每百萬輸入標記 $0.20,每百萬輸出標記 $1.25——這個價格點讓新創公司每天大量查詢在經濟上變得可行。作為參考,Nano 在輸入方面約是 Mini 的四倍便宜。 對於普通的 ChatGPT 用戶,GPT-5.4 Mini 今日已在 Plus 菜單中的“思考”選項提供給 Free 和 Go 用戶。付費訂閱者若達到 GPT-5.4 的速率限制,將自動切換回 Mini。而 GPT-5.4 Nano 目前僅提供 API——OpenAI 明確將其定位為開發者工具,而非消費者產品。

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言