根據 Anthropic 官方模型退役文件,Claude Haiku 3(模型 ID:claude-3-haiku-20240307)已於 2026 年 4 月 19 日正式停止服務。此日期之後,所有對該模型的 API 請求將直接回報錯誤,Anthropic 不會自動將流量導向新版本,開發者必須主動更新程式碼中的模型 ID 至 Haiku 4.5。這是本年度第一個大型 Claude 模型的 lifecycle 終止事件。
影響範圍以輕量應用為主
Claude Haiku 3 於 2024 年 3 月推出,是 Anthropic 當時最便宜、最快的模型,廣泛用於客服 bot、摘要、分類、內容審核等高頻但輕量的任務。兩年後的今日,不少中小型 SaaS 與內部工具仍在使用此模型,理由是 prompt 與成本已深度調教、替換需重跑 QA。本次退役預告期自 2 月起已開始,Anthropic 透過官方通知、email、dashboard 警告對所有企業合約客戶發出至少 60 天事前通知。
遷移至 Haiku 4.5 的兩項破壞性變更
官方建議的替代方案為 Claude Haiku 4.5,但遷移並非僅修改字串即可。開發者需留意兩項破壞性變更:一是 temperature 與 top_p 兩個採樣參數現在僅允許擇一設定,若既有程式碼兩者都有明確數值,Anthropic 的 API 將回報錯誤;二是 Haiku 4.5 新增 refusal stop reason,當模型拒絕回應時會回傳此標記,而非像 Haiku 3 一樣直接 error 或回覆 placeholder — 產品程式碼必須將 refusal 當成正常路徑處理。
此外,上週 Opus 4.7 tokenizer 變更造成帳單暗漲的爭議,同樣可能套用在 Haiku 4.5 上 — 即使 rate card 標示更低的 per-token 價格,實際業務任務的 token 消耗可能因 tokenizer 不同而異,建議所有遷移計畫在切換當天實測對比成本。
AI 模型生命週期管理成為企業必修課
本次退役提醒企業 AI 基礎設施的一個結構性變化:LLM 已從「一次性採購」進入「持續版本管理」的階段,類似雲端服務與作業系統。Anthropic 官方 deprecation 頁面同時預告 Claude Opus 4、Sonnet 4 將於 2026 年 6 月 15 日退役,時程密集。企業 AI 採購條款應加入「最低支援期」、「替代模型自動可用」、「遷移測試補貼」等合約項目,否則生產服務可能因模型下架而中斷。
對台灣開發者與 SaaS 團隊的行動建議
三個立即動作:第一,搜尋所有程式碼倉庫與設定檔,把 claude-3-haiku-20240307 改成 claude-haiku-4-5;第二,檢查 API 呼叫中是否同時設定 temperature 與 top_p,擇一保留;第三,在 handler 中新增 refusal stop reason 的處理分支,避免意外的 user-facing error。對 使用按量計費企業合約的組織而言,切換當週監控 token 消耗變化也是必要動作,避免 tokenizer 差異帶來的意外超支。
這篇文章 Claude Haiku 3 於 4/19 正式退役:Anthropic 強制遷移至 Haiku 4.5,開發者須改模型 ID 與參數設定 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Chrome 變「AI 同事」:Auto Browse 自動化網頁任務、企業版月費 6 美元
Chrome Enterprise 推出 Gemini 驅動的 Auto Browse 與 Chrome Skills,讓瀏覽器自動執行多步任務,但需使用者點擊確認;可儲存/分享 AI 工作流,並與 Gmail、日曆、Drive 整合,含 DLP 控管,月費 6 美元,定位為把瀏覽器變成 AI 同事。
鏈新聞abmedia19分鐘前
OpenAI 推 ChatGPT Workspace Agents:Codex 驅動、團隊共享、Slack 整合
OpenAI於4月22日在ChatGPT Business/Enterprise/Edu/Teachers推出WorkspaceAgents,由Codex驅動、雲端長時、團隊共用且可離線執行,能在Slack主動回應與開票、執行多步工作流,並支援排程。研究預覽免費到5月6日,之後採credit-based收費,價格待公布。與GoogleGeminiEnterpriseAgentPlatform、AnthropicClaudeCowork同場競爭,三家聚焦企業級代理但定位各有不同。
鏈新聞abmedia21分鐘前
Google Cloud Next 2026:推出 Gemini 企業代理平台,7.5 億美元助顧問落地
Google Cloud 在 Cloud Next 2026 公布 Gemini Enterprise Agent Platform,整合模型選擇、代理建構、DevOps、編排與企業安全控管,並推出 7.5 億美元基金協助 McKinsey、Accenture、Deloitte 部署企業代理。平台搭配 Ironwood TPU、A2A 與 MCP,打造自家全棧與顧問通路,對抗 OpenAI Operator 與 Anthropic Claude 企業版。
鏈新聞abmedia23分鐘前
Google 擴展 Wiz 雲端安全性至 AWS、Azure 和 Google Cloud
Google 宣布新的安全功能,以及它在 Cloud Next '26 活動中,所收購的以色列雲端安全公司 Wiz,於其 Google Cloud 與競爭對手平台之間更深度的整合;這筆交易據稱為 US$32 billion。該公司在預覽模式下推出三個用於安全營運的 AI 代理,旨在為
Crypto Frontier32分鐘前
Microsoft將於2029年前投資171.9億美元於澳洲的AI與雲端基礎設施
Microsoft承諾到2029年投入AU$25B 以擴大澳洲的AI與雲端基礎設施,與政府機關深化網路防禦,加速到2028年培訓300萬名AI人才,並協調資料中心與AI政策,以強化主權。
Microsoft在澳洲的AU$25 億擴張計畫將於2029年前落地,旨在提升在地AI與雲端能力,並在先前的AU$5 億承諾基礎上推進。該計畫將與澳洲通訊與媒體管理局(Australian Signals Directorate)一起擴大「Cyber Shield」計畫,到2028年培訓300萬人具備AI技能,並與澳洲AI安全研究院(Australian AI Safety Institute)合作;同時,將資料中心與AI基礎設施的要求制度化,與政府協作以強化數位主權。
GateNews34分鐘前
阿里巴巴 Qwen 向外部夥伴開放 AI 服務;中國東方航空首家完成整合
阿里巴巴向外部合作夥伴開放 Qwen AI 服務;中國東方航空成為第一家非阿里巴巴的外部企業,部署端到端的 AI 航班訂位服務,讓用戶能夠請求像是經濟實惠的直飛航班或寬敞座位等選項。
GateNews54分鐘前