Kimi K2.6 登顶 OpenRouter 编程基准,超越 Claude 和 GPT 系列

Gate News 消息,4 月 22 日——Kimi.ai 宣布,其最新模型 Kimi K2.6 已在 OpenRouter 编程能力榜单中排名第一,成为开发端评测中的领先模型。

基准数据表明,Kimi K2.6 在编程任务的综合表现上,相较于包括 Claude、GPT 系列以及其他开源模型在内的主流模型都更为出色,反映出其在代码生成和开发任务处理方面的显著改进。这一成果对国内 AI 模型在真实开发场景中的表现而言,具有重要里程碑意义,进一步缩小了与国际领先模型之间的差距。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Anthropic 武器级网络安全模型 Mythos 遭未授权访问:他们是如何做到的?

彭博报道,一私人论坛群组通过 Anthropic 第三方承包商的合法授权,未授权访问 Mythos。Mythos 为企业用的防御型 AI,仅开放给经过严格审核的大型机构。该群组利用对模型 URL 的掌握推测系统位置进入,并提供截图示范,称仍在使用但无恶意。Anthropic 正在调查,初步认定为权限滥用而非外部入侵。此事显示将高敏感模型交由第三方管控的风险,需提升治理韧性与信任机制。

鏈新聞abmedia9 分钟前

慢雾首席信息安全官(CISO)发出警示:ShinyHunters 声称入侵 Anthropic 内部系统

根据慢雾(SlowMist)首席信息安全长 23pds 于 4 月 23 日在 X 平台发布的警示,黑客组织 ShinyHunters 声称已入侵与 Anthropic Mythos 模型相关的内部系统,并公开分享用户管理面板、AI 实验仪表板及模型性能与成本分析等截图佐证,但 Anthropic 官方尚未发表声明。

Market Whisper11 分钟前

Chrome 变“AI 同事”:Auto Browse 自动化网页任务、企业版月费 6 美元

Chrome 企业推出基于 Gemini 的 Auto Browse 和 Chrome Skills,使浏览器能够自动执行多步骤任务,但需要用户点击确认;可保存/分享 AI 工作流,并与 Gmail、日历、Drive 集成,包含 DLP 管控,每月 6 美元,定位为把浏览器变成 AI 同事。

鏈新聞abmedia45 分钟前

OpenAI 推出 ChatGPT Workspace Agents:Codex 驱动、团队共享、Slack 集成

OpenAI于4月22日在ChatGPT Business/Enterprise/Edu/Teachers推出WorkspaceAgents,由Codex驱动、云端长时、团队共享且可离线执行,能在Slack主动回应与开票、执行多步工作流,并支持排程。研究预览免费到5月6日,之后采用credit-based计费,价格待公布。与GoogleGeminiEnterpriseAgentPlatform、AnthropicClaudeCowork同场竞争,三家聚焦企业级代理但定位各有不同。

鏈新聞abmedia47 分钟前

Google Cloud Next 2026:推出 Gemini 企业代理平台,7.5 亿美元助顾问落地

Google Cloud 在 Cloud Next 2026 公布 Gemini 企业代理平台,整合模型选择、代理构建、DevOps、编排与企业安全管控,并推出 7.5 亿美元基金以协助 McKinsey、Accenture、Deloitte 部署企业代理。平台搭配 Ironwood TPU、A2A 与 MCP,打造自家全栈与顾问通路,对抗 OpenAI Operator 与 Anthropic Claude 企业版。

鏈新聞abmedia49 分钟前

Google 扩展 Wiz 云安全至 AWS、Azure 和 Google Cloud

Google 宣布了新的安全功能,以及其在收购以色列云安全公司 Wiz 后,将其在美国$32 十亿美元规模内更深度集成到 Google Cloud 和竞争对手平台的相关计划,具体将在其 Cloud Next '26 活动中展示。该公司以预览模式推出了面向安全运营的三个 AI 代理,旨在为

Crypto Frontier58 分钟前
评论
0/400
暂无评论