DeepSeek V3.2正式版发布:强化Agent能力,融入思考推理

金色财经报道,今天,我们同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2是我们推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。我们提出了一种大规模Agent训练数据合成方法,构造了大量“难解答,易验证”的强化学习任务(1800+环境,85,000+复杂指令),大幅提高了模型的泛化能力。(DeepSeek)

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
GateUser-0ada9794vip
· 2025-12-04 16:10
牛证 🐂
查看原文回复0
GateUser-0ada9794vip
· 2025-12-04 16:10
牛证 🐂
查看原文回复0