Andrej Karpathy 开源 autoresearch 项目，AI 自动运行百次 LLM 训练实验

GateNews

2026-03-09 03:07:58

Gate News 消息，3 月 9 日，Eureka Labs 创始人、OpenAI 联合创始人 Andrej Karpathy 昨日（3 月 8 日）公开开源项目 autoresearch，将此前在 LLM 训练项目 nanochat 上的 AI Agent 自动调优工作流独立打包，供开发者使用。该项目采用「人写 Markdown，AI 写代码」的设计模式：开发者通过编写 program.md 文件定义研究方向，AI Agent 自主修改包含完整 GPT 模型、Muon + AdamW 优化器和训练循环的 train.py 代码（约 630 行）。每次实验固定运行 5 分钟，以验证集每字节比特数（val_bpb）为唯一评估指标，优于基线的改进将被保留提交，否则丢弃。按此节奏，每小时可运行约 12 次实验，一夜可完成约 100 次。Karpathy 展示的示例显示，83 次实验中产出 15 次有效改进。该项目仅需一块 NVIDIA GPU（已在 H100 上测试），依赖 PyTorch 和少量软件包，采用 MIT 协议开源。目前社区已出现 macOS 和 MLX 适配分支。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

0/400

暂无评论