Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款机器学习研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。
ml-intern 工具链围绕 Hugging Face 生态系统设计。它从 arXiv 和 HF Papers 检索论文,同时追踪引文链以便更深入阅读;在 HF Hub 上浏览数据集,验证质量,并将数据重新格式化以用于训练;当本地 GPU 资源不可用时,它会调用 HF Jobs 来启动基于云端的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。
Hugging Face 展示了三个使用案例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度等级从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮监督微调,使 GPQA 分数在 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其放大 50 倍用于训练,在 HealthBench 上相较 Codex 的表现提升了 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后开展了消融实验。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenAI 推出 ChatGPT Workspace Agents:Codex 驱动、团队共享、Slack 集成
OpenAI于4月22日在ChatGPT Business/Enterprise/Edu/Teachers推出WorkspaceAgents,由Codex驱动、云端长时、团队共享且可离线执行,能在Slack主动回应与开票、执行多步工作流,并支持排程。研究预览免费到5月6日,之后采用credit-based计费,价格待公布。与GoogleGeminiEnterpriseAgentPlatform、AnthropicClaudeCowork同场竞争,三家聚焦企业级代理但定位各有不同。
鏈新聞abmedia49 分钟前
Google Cloud Next 2026:推出 Gemini 企业代理平台,7.5 亿美元助顾问落地
Google Cloud 在 Cloud Next 2026 公布 Gemini 企业代理平台,整合模型选择、代理构建、DevOps、编排与企业安全管控,并推出 7.5 亿美元基金以协助 McKinsey、Accenture、Deloitte 部署企业代理。平台搭配 Ironwood TPU、A2A 与 MCP,打造自家全栈与顾问通路,对抗 OpenAI Operator 与 Anthropic Claude 企业版。
鏈新聞abmedia50 分钟前
Google 扩展 Wiz 云安全至 AWS、Azure 和 Google Cloud
Google 宣布了新的安全功能,以及其在收购以色列云安全公司 Wiz 后,将其在美国$32 十亿美元规模内更深度集成到 Google Cloud 和竞争对手平台的相关计划,具体将在其 Cloud Next '26 活动中展示。该公司以预览模式推出了面向安全运营的三个 AI 代理,旨在为
Crypto Frontier59 分钟前
360 AI 漏洞发现代理发现近 1,000 个零日漏洞,与 Mythos 竞争
360 Digital Security 的 AI 驱动代理声称已发现约 1,000 个新的漏洞,包括 Office 和 OpenClaw;AI 现在是发现与利用链预备的核心,媲美 Mythos。
摘要:据彭博援引的一份报告称,360 Digital Security Group 的 AI 驱动漏洞发现代理在近几个月识别出近 1,000 个此前未知的漏洞,其中包括 Microsoft Office 和 OpenClaw 框架。该公司表示,AI 已成为漏洞发现的核心引擎,并宣布了一款 AI 工具以加速构建利用链。Benincasa 依据 Natto Thoughts 对该公司中文公告的解读,将 360 描述为 Anthropic 的 Mythos 的竞争对手。
GateNews12小时前
Aethir Claw V1 上线:无需代码,五分钟内部署 AI 代理
Gate 新闻消息,4月22日——Aethir,这家去中心化 GPU 云基础设施提供商,今天发布了其 AI 代理托管平台 Aethir Claw 的 1.0 版本。该平台使没有技术背景的用户能够在五分钟内完全在浏览器中部署并配置 AI 代理
GateNews13小时前
Google 推出 AI 代理工具,帮助企业自动化任务
Google 透露了用于构建 AI 代理的工具,以自动化任务、跟踪进度并通过专门的代理收件箱来管理工作流程;同时配合 Workspace 的更新,并展望 AI 代理将重塑日常员工的工作惯例。
摘要:Google 发布了用于创建 AI 代理的工具,用于任务自动化、监控其进度并简化工作流程,这表明 Workspace 的更新以及 AI 代理将改变日常工作的未来。
GateNews14小时前