Anthropic 指控三家中国 AI 公司 DeepSeek、Moonshot AI 以及 Min,透过蒸馏法复制其模型能力。此举遭网友反讽其亦违规抓取版权物,同时引发美国对芯片出口与国家安全防护的激辩。
AI 聊天机器人 Claude 开发商 Anthropic 公开指控,三家中国 AI 实验室 DeepSeek、Moonshot AI 以及 Min,通过设立超过 24,000 个虚假账号,对 Claude 模型进行超过 1,600 万次的数据存取与交流,并利用蒸馏法技术,企图将 Claude 的核心能力转移至自家模型。
“蒸馏法”是一种常见的 AI 训练技术,主要通过让较旧或规模较大且成熟的模型来评估新模型生成的答案质量,进而让体积较小且成本较低的模型,能够学习并转移大型模型的运算成果。
蒸馏技术原本是 AI 业界为了打造轻量化模型所使用的合法训练方式,但竞争对手也能利用这种方式直接复制其他实验室的研究成果。
Anthropic 指出,这三家中国 AI 实验室使用了代理服务器来规避检测,并针对 Claude 最具差异化的代理推理、工具使用以及代码编写能力进行大规模获取。
图源:X Anthropic指控3家中国AI蒸馏训练,获取先进模型能力
不过,在 Anthropic 发布声明后,却引发大量网友的嘲讽与质疑,一些网友认为 Anthropic 针对模型训练方式的态度有双重标准。
AI 基础设施公司 IO.Net 共同创办人 Tory Green 则发文批评,AI 公司们利用公开网络资料进行训练,却在别人向他们学习时称之为蒸馏攻击,平时高喊开放研究的 Anthropic,如今却因为开放存取而抱怨。
**2025 年,美国知名论坛 Reddit 正式起诉 Anthropic,指控该公司在未经授权下抓取超过 10 万篇论坛贴文与留言,用于微调 Claude 模型。**Reddit 指控,Anthropic 违反了用户协议,甚至在公开宣称停止抓取行为后,仍持续存取 Reddit 服务器高达十万次以上。
另外,Anthropic 也因盗版使用 700 万本书籍训练其模型 Claude 而遭集体诉讼,并于去年 9 月同意赔偿高达 15 亿美元来和解,创造美国史上最大金额的版权和解纪录,不过该赔偿金仍待法院批准。
除了 Anthropic 之外,AI 巨头 OpenAI 也面临相同的处境。
根据《路透社》上周看到的一份内部备忘录,OpenAI 已对美国立法者提出警告,指出 DeepSeek 正以 ChatGPT 开发商及美国领先的 AI 公司为目标,企图复制模型并将其用于自家的算法训练。
OpenAI 观察到与 DeepSeek 员工相关的账号,正开发各种方法来规避 OpenAI 的存取限制。通过经过混淆的第三方路由器以及其他隐藏来源的方式,以程式化手段存取美国的人工智能模型,并获取输出结果以进行蒸馏训练。
在美国 AI 巨头指控中国的蒸馏法训练技术时,美国正面临对中国芯片出口管制政策激辩的敏感时期,川普政府在 1 月正式允许辉达等美国企业,向中国出口 H200 等先进 AI 芯片。
批评者认为,在全球 AI 主导权竞争的关键时刻,放宽出口管制将会大幅增加中国的 AI 计算能力。
Silverado Policy Accelerator 智库主席 Dmitri Alperovitch 表示,中国 AI 模型进步神速的部分原因,正是通过蒸馏技术窃取美国的前沿模型。这些证据提供了更具说服力的理由,他呼吁美国应该拒绝向这些公司出售任何 AI 芯片,否则只会进一步扩大他们的优势。
Anthropic 则警告,美国企业建立的 AI 系统具备防止国家或非国家行为者,利用 AI 开发生物武器或进行恶意网络活动的安全防护机制。但通过蒸馏技术建立的 AI 模型,通常缺乏必要的防护措施。
Anthropic 担忧,如果国外 AI 实验室可以将这些毫无限制的能力整合到军事与情报系统中,让威权政府得以运用 AI 来执行攻击性网络行动、假消息宣传以及大规模监控,那么相关的安全风险将成倍增加。
延伸阅读:
中国黑客发起大规模 AI 网络攻击!Anthropic:AI 黑客速度、规模已超越人类黑客