OpenAI 追踪 Goblin 问题到书呆子型人格奖励信号,Goblin 提到其在 GPT-5.1 中飙升 175%

根据 OpenAI, 该公司确定了从 GPT-5.1 开始困扰 GPT 模型的“哥布林”问题的根本原因。用于强化“书呆子(Nerdy)”人格特质的奖励信号,鼓励生成包含奇幻生物引用的内容,而 76.2% 的训练数据集显示存在这种偏置。“书呆子(Nerdy)”人格仅占 ChatGPT 回答的 2.5%,但却贡献了 66.7% 的“哥布林(goblin)”提及,且从 GPT-5.2 到 GPT-5.4 的出现次数飙升了 3,881%。

OpenAI 于 3 月移除了“书呆子(Nerdy)”人格,消除了有偏置的奖励信号,并对训练数据进行了过滤。该公司还在 Codex 中为 GPT-5.5 的开发者提示加入了抑制指令。此次调查促成了新模型行为审计工具的开发。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Forefront Tech 完成 $100M IPO 定价,计划在 Nasdaq 上市

据 ChainCatcher 报道,Forefront Tech Holdings Acquisition Corp 于 4 月 30 日完成 1 亿美元 IPO 定价,计划在纳斯达克上市,股票代码为 FTHAU。募集资金将用于探索区块链、人工智能、金融科技及其他领域的并购机会

GateNews20 分钟前

前 Meta 高管为 AI 初创公司 Flourish 融资,并以 25 亿美元估值

据 Bloomberg,曾领导 Meta 的 Neural Band 相关工作的前 Meta 高管 Thomas Reardon 正在为 Flourish 融资,这是一家专注于低功耗 AI 系统的新 AI 初创公司。Lux Capital 和 Google Ventures 已同意成为主要投资方,支持者目前已承诺投入 5 亿美元,估值 2.5

GateNews22 分钟前

英伟达 Blackwell GPU 成本翻倍,但单 token 推理成本较 Hopper 下降 35 倍

根据 Nvidia 最新博客分析,Blackwell GPU 的每小时成本几乎是 Hopper 代的两倍,但每 token 推理成本低 35 倍。以 DeepSeek-R1 作为测试模型,Blackwell(GB300 NVL72)租赁价格为每 GPU 每小时 2.65 美元,而 Hopper 为 1.41 美元,但单个 GPU

GateNews56 分钟前

并行 Web 系统以 $100M 估值进行 $2B 系列 B 融资,由红杉领投

据 TechCrunch 报道,Parallel Web Systems,这家由前 Twitter 首席执行官 Parag Agrawal 创立的人工智能初创公司,已在 Sequoia 领投的 B 轮融资中筹集 1 亿美元,估值 20 亿美元。该轮融资使公司的融资总额达到 2.3 亿美元,距离其 1 亿美元的 A 轮融资仅过去五个月。Parallel Web Systems

GateNews1小时前

BitMart 币市 8 周年晚宴:为台湾用户导入 AI 自动化交易与本地化服务

BitMart 币市於台北君品舉辦 8 週年晚宴,超过 150 位嘉賓出席,回顾八年发展並宣布在地化与 AI 自动交易策略。BitMart Skill 結合 Blave,让用戶无需程式即可透过 AI 自动交易並取得即时數據洞察。全球用戶突破 1300 万、上線項目超过 4800、交易量逾 1 万亿美元。晚宴设有真人财神爺与豐厚禮品,展现深耕台灣的決心。

鏈新聞abmedia1小时前

软银计划 2026 年上市 Roze,估值目标 1000 亿美元

根据《金融时报》(FT)于 4 月 30 日独家报道,软银(SoftBank)正计划在美国拆分成立一家全新独立公司,名为 Roze,业务涵盖 AI 机器人与数据中心基础设施,目标最快于 2026 年完成 IPO,估值目标定于 1,000 亿美元。《金融时报》同时报道,软银内部对估值目标及 IPO 时间表存在疑虑。

Market Whisper1小时前
评论
0/400
暂无评论