05:21
DeepSeek V4 引发美国争论:智库质疑芯片使用,Replit CEO 为开放创新辩护
Gate 新闻消息,4月24日——围绕 DeepSeek V4 的技术能力与合规性,美国国内爆发了一场争论。克里斯·麦圭尔(Chris McGuire),外交关系委员会(Council on Foreign Relations)高级研究员 (CFR),以及前白宫国家安全委员会和国防部官员,发布了分析,认为 V4 并未改变美国-中国 AI 的竞争格局。根据麦圭尔的说法,DeepSeek 自己的 V4 报告承认,其推理能力相较于前沿模型大约落后 3 到 6 个月,并以在六个月前发布的 GPT-5.2 和 Gemini 3.0 Pro 进行基准测试。
麦圭尔提出担忧:尽管 V4 报告披露了在推理阶段对 NVIDIA GPU 和华为 Ascend NPU 的适配,但它并未在公开信息中具体说明开发过程中使用的 GPU 型号或训练成本。他质疑这种沉默是否意味着使用了受出口管制的 NVIDIA Blackwell 芯片,并指出此前 V3 曾宣称以 2,000 张 H800 GPU、成本为 5.57 million 美元进行训练。DeepSeek 已否认使用 Blackwell,称该模型是在 NVIDIA H800 和华为 Ascend 910C 处理器上训练的。
Replit CEO 阿姆贾德·马萨德(Amjad Masad)反驳了麦圭尔的分析,认为中国科学家正在公开分享真正的 AI 突破,而美国的政策制定者和游说人士则放大“China distillation(中国蒸馏)”方面的担忧。马萨德强调了 DeepSeek 官方声明中披露的架构创新,包括令牌级注意力压缩 DeepSeek Sparse Attention,以及针对长上下文计算的显著效率提升。他指出,V4-Pro 在 1M 上下文长度下,相较于 V3.2 展示出更低的单令牌推理计算量和 KV cache 需求,并强调这些架构进步与训练数据蒸馏无关,所有研究者——包括美国的实验室——都可以从开源发展中受益。
المزيد