DeepSeek V3.2正式版發布:強化Agent能力,融入思考推理

金色財經報道,今天,我們同時發布兩個正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2是我們推出的首個將思考融入工具使用的模型,並且同時支持思考模式與非思考模式的工具調用。我們提出了一種大規模Agent訓練數據合成方法,構造了大量“難解答,易驗證”的強化學習任務(1800+環境,85,000+復雜指令),大幅提高了模型的泛化能力。(DeepSeek)

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
GateUser-0ada9794vip
· 2025-12-04 16:10
牛證 🐂
查看原文回復0
GateUser-0ada9794vip
· 2025-12-04 16:10
牛證 🐂
查看原文回復0