百度的ERNIE 5 AI模型登顶榜单——一款超越OpenAI GPT 5.1的数学天才

Decrypt

简要总结

  • 百度最新的 ERNIE 5.0 在全球AI模型中占据一席之地,在 LMArena 上击败 GPT-5.1,并在数学任务中排名第2。
  • ERNIE 的 v4 版本于两年前发布。
  • 强大的企业应用弥补了百度在国内激烈竞争中的消费者AI挫折。

中国科技巨头百度刚刚更新了其最先进的AI模型——效果似乎相当不错。 该公司的 ERNIE-5.0-0110 在 LMArena 的文本排行榜上获得了1460分,全球排名第8,成为唯一进入平台前10的中国模型。它的表现优于 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 于2023年发布。 ERNIE 5.0 在数学推理方面也位居全球第2,仅次于尚未发布的 GPT-5.2-High。对于一个中国模型来说,能在复杂逻辑任务中超越几乎所有公开的西方系统,标志着AI能力差距的显著缩小——或者说,正在逐步缩小。

对,数学全球第2让ERNIE进入了一个完全不同的对话。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度在X上的公告强调,ERNIE 5.0 已正式退出预览阶段。该模型在创意写作、指令执行和编码等方面也表现出色,在多个职业类别中均进入前10名,包括科学、商业与金融以及医疗保健。

🚨 最新消息:@Baidu_inc 的 ERNIE-5.0-0110 在 LMArena 上取得了令人印象深刻的成绩。这不是测试或预览。

在最新排名中,该模型在文本基准测试中得分1460,位列中国模型第一,并进入全球前10——这是唯一的中国模型…… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

这些成果背后的技术架构遵循中国对效率而非纯粹算力的关注。ERNIE 5.0 采用大约2万亿参数的专家混合架构(Mixture-of-Experts),每次推理只激活一小部分专家((准确来说,只有3%))。 与其他稀疏前沿模型类似,这种设计相比密集系统减少了每次查询的计算量,但也带来了额外的工程复杂性。百度还表示,ERNIE 5.0 在文本、图像、音频和视频上原生训练,而不是在语言核心上后期添加多模态模块。公司称这使得ERNIE成为一个原生“全模态”AI模型。

考虑到百度曾经的跌落,这次反弹尤为引人注目。去年11月,ERNIE 5.0 的预览版在 LMArena 上排名跌至第24位。国内AI市场由更灵活的竞争对手主导:字节跳动的抖宝拥有1.01亿月活跃用户,而深度探索的高效模型引发了价格战,迫使百度在去年四月完全放弃了付费订阅模式。 但消费者市场的挫折并未减缓百度的企业端动力。ERNIE 目前在中国多个智慧城市指挥中心部署,为所有系统重要的中国银行提供服务,每天处理165亿次API调用。这一B2B的坚实基础使百度免受激烈的消费者竞争影响,同时也支持持续的模型开发。 除了大规模语言模型的纯算力外,ERNIE 聊天机器人的用户界面也相当友好,配备了丰富的预设功能,帮助用户根据需求获得更个性化的结果。例如,用户无需面对复杂的提示词,就能在写作、阅读、图像编辑和通用用途等不同部分轻松操作。这是同一核心模型,但系统提示和微调的不同,使每个任务都更易完成。

有趣的是,最新版本没有开启网页搜索功能,因此完全离线。不过,用户可以切换到之前的 Ernie 4.5 版本,开启网页搜索功能以获取更新信息。 反应不一,有些用户仍在等待模型性能和基准测试的更详细细节,公司承诺很快会公布。此外,值得注意的是,虽然 ERNIE 5.0 在某些基准测试中与 GPT-5 和 Gemini 2.5 相当,但许多西方实验室已经转向 GPT-5.2 或 Gemini 3,这使得此次更新更像是追赶而非领先。 用户可以在 ernie.baidu.com 免费测试该模型。

查看原文
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)