🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
我只是注意到在观察AI行业时发生了一种奇怪的模式。八年前,一个中国电信公司因为一项禁运而彻底失去了生命。但现在,其他中国AI公司在面对更高压力的情况下仍在快速成长。到底发生了什么变化?
让我们回到2018年。中兴通讯是全球最大的电信设备制造商之一——80,000名员工,数十亿的年收入。然后一天之内,美国工业与安全局的一项命令就关闭了整个公司。没有美国零件,没有谷歌许可证,没有操作系统。三周后,中兴宣布无法继续运营。公司支付了14亿美元的罚款,但真正的问题在于生态系统——他们完全依赖由美国控制的全球供应链。
如今,尽管仍有类似的限制,中国的AI公司却没有遭遇同样的命运。为什么?因为问题不仅仅是硬件。真正的瓶颈是CUDA。
我之所以提到这个,是因为大多数人假设芯片禁令关乎芯片本身。错了。CUDA——NVIDIA自2006年以来的并行计算平台——才是真正的障碍。全球所有主要的AI框架,从谷歌的TensorFlow到Meta的PyTorch,都深度依赖CUDA。每当AI研究人员学习编程,CUDA都是他们的第一工具。每一行代码都在增强NVIDIA的生态系统。
到2025年,CUDA生态系统中将有450万开发者,超过3000个GPU加速应用,以及全球4万多家公司在使用它。这占全球AI开发者的90%。这就像一个飞轮,一旦启动,几乎难以停止。开发者越多,工具越多。工具越多,加入的开发者越多。结果就是?NVIDIA制定规则,所有人都在遵循。
因此,从2022年到2024年,美国政府实施了三轮对NVIDIA芯片出口的限制。第一轮是A100和H100,接着是A800和H800,最后是H20。但这并没有引发像对中兴那样的恐慌。为什么?因为中国公司转而专注于算法优化,而不是反抗硬件。
DeepSeek就是最好的例子。他们的V3模型有6710亿参数,但每次推理只用到370亿参数——仅占总数的5.5%。为了训练这个模型,他们只用了2048块NVIDIA H800 GPU,花了58天,总成本约55.76亿美元。相比之下,GPT-4的估算成本为7800万美元。差异一两个数量级。
价格更是说明问题。DeepSeek的API输入每百万tokens收费0.028到0.28美元,输出0.42美元。GPT-4的输入成本为5美元,输出15美元。Claude Opus更贵——输入15美元,输出75美元。DeepSeek的价格便宜25到75倍。这一价格差异引发了开发者市场的巨大转变。
到2026年2月,在OpenRouter——最大的AI模型API聚合平台——中国AI模型的每周使用量在三周内激增127%,首次超过美国。去年,中国模型的市场份额不到2%。现在增长了421%,接近6%。但更深层次的变化不仅仅在价格。从2025年中期开始,主要的AI应用从聊天转向代理。在代理场景中,tokens的使用量比简单聊天高出10到100倍。当tokens的消耗指数级爆炸时,价格就成为决定因素。中国模型的极高成本效率正好赶上了这个窗口。
但算法优化不仅仅解决了训练问题。如果不能用最新数据进行训练和迭代,模型很快就会过时。训练需要巨大的计算能力。那么中国公司从哪里获得计算基础设施?
江苏省兴化市有一个小城市——以不锈钢和健康食品闻名——但到2025年,这里建成了一条148米的服务器生产线。从签约到投产仅用了180天。核心是两款完全自主的芯片:龙芯3C6000处理器和泰楚远驰T100 AI加速卡。龙芯拥有从指令集到微架构的自主设计。泰楚远驰由无锡国家超级计算中心和清华大学合作开发,采用异构多核架构。
满负荷运转时,每5分钟就能生产一台服务器。总投资11亿元人民币,预计年产10万台。重要的是,数千个本地芯片的集群开始处理真正的大模型训练。2026年1月,智谱AI联合华为发布了GLM-Image——首个完全用本地芯片训练的SOTA图像生成模型。2月,中国电信在上海临港的数千GPU本地算力池中完成了百亿级星辰模型的全流程训练。
这意味着什么?只有一个结论:本地芯片已从仅能推理转变为支持训练。这是质的飞跃。推理只需预训练模型,硬件要求较低。训练则需要处理海量数据、复杂的梯度计算、参数更新——对计算能力、互连带宽和软件生态的要求更高。
推动这一变革的主要力量是华为昇腾系列。到2025年底,昇腾生态的开发者已达400万,合作伙伴超过3000家,43个主要模型完成了昇腾预训练,另外200多个开源模型也在适配中。2026年3月2日,在MWC上,华为推出了新一代SuperPoD算力基础设施,面向海外市场。昇腾910B的FP16算力已达NVIDIA A100的水平。虽然仍有差距,但已从完全无法用到变得可用。生态系统的建设不应等待完美芯片——应在足够成熟时广泛部署,利用实际商业需求推动芯片和软件的更新。
字节跳动、腾讯、百度的本地服务器部署目标预计在2026年将比去年翻倍。据工业和信息化部数据显示,中国的智能计算规模已达1590 EFLOPS。2026年将成为本地算力大规模部署的年份。
但另一方面,能源问题同样重要。弗吉尼亚州处理着全球大量数据中心流量,暂停了新数据中心的许可。乔治亚州暂停至2027年。伊利诺伊州和密歇根州也发布了限制措施。根据国际能源署,2024年美国数据中心的用电量达183太瓦时,约占全国总用电的4%。到2030年,预计将翻倍至426太瓦时,可能超过12%。Arm的CEO表示,到2030年,仅AI数据中心的用电量可能占到美国总用电的20-25%。
美国电网已接近极限。覆盖13个东部州的PJM电网容量短缺6GW。到2033年,美国整体将面临175GW的电力容量短缺,相当于1.3亿户家庭的用电量。数据中心集中的地区电价比五年前上涨了267%。计算能力的边界在于能源。
但在能源方面,中美之间的差距比芯片还要大,但方向相反。中国的年度发电量为9100亿亿度,而美国为4.2万亿度——中国是美国的2.5倍。更重要的是,中国家庭用电只占总用电的15%,而美国为36%。这意味着中国可能拥有更大的工业用电容量,用于构建计算能力。
仅电价方面——美国的AI公司所在地区电价为每千瓦时0.12到0.15美元,而中国西部工业区的电价约为每千瓦时0.03美元,是美国价格的一半甚至五分之一。中国的发电优势是美国的7倍。
当美国担心电力问题时,中国的AI在海外悄然发展。但这次,不是产品或工厂在增长,而是tokens。tokens是AI模型考虑的最小信息单位,已成为一种新的数字商品。在中国的计算工厂生产,通过海底光缆运往全球。
DeepSeek的用户分布很清楚:30.7%来自中国,13.6%来自印度,6.9%来自印度尼西亚,4.3%来自美国,3.2%来自法国。支持37种语言,在巴西等新兴市场广受欢迎。全球有2.6万家公司可能拥有账户,3,200个机构使用企业版。到2025年,58%的新AI创业公司将DeepSeek集成到技术栈中。在中国,DeepSeek占据了89%的市场份额。在其他训练市场,市场份额在40%到60%之间。
这种观点就像四十年前发生的行业控制权丧失战。1986年东京,在美国的强大压力下,日本政府签署了美日半导体协议。主要特征包括:开放日本半导体市场,美国芯片市场份额必须超过20%,禁止低于成本的半导体出口,对出口芯片征收100%的罚金(30亿美元)。美国拒绝了富士通收购费尔柴尔德的请求。那一年,日本半导体行业达到巅峰。到1988年,日本控制了全球半导体市场的51%,美国为36.8%。在全球前十的半导体公司中,有六家来自日本:NEC第二,东芝第三,日立第五,富士通第七,三菱第八,松下第九。
但签署协议后,一切都变了。美国利用301调查全面打压日本半导体企业。同时支持三星和SK海力士从韩国出发,打击日本市场的低价竞争。日本的DRAM市场份额从80%跌至10%。到2017年,日本的IC市场份额仅剩7%。曾经强大的公司要么分拆、要么被收购、要么在无休止的亏损中退出。
日本半导体的悲剧在于他们满足于由外部力量主导的全球分工,作为最好的生产者,却从未考虑建立自主生态系统。当浪潮退去时,才发现自己除了制造业一无所有。
当前的中国AI行业也面临类似但完全不同的战役。也遭遇重大外部压力。芯片收紧的三轮浪潮不断加强,CUDA生态的壁垒依然高企。不同的是,这次选择了更难的路径——从极端的算法优化,到本地芯片的自主研发,从推理到训练的转变,吸引了400万开发者加入昇腾生态,甚至将tokens推向全球市场。每一步都在构建一个日本从未拥有的独立产业生态。
2026年2月27日,三家本地AI芯片公司公布了业绩。寒武纪营收增长453%,首次实现全年盈利。摩尔线程营收增长243%,但净亏损10亿美元。牧星营收增长121%,净亏损近80亿美元。一半是火,一半是水。火代表市场的渴望。黄伟的95%空间由本地公司收入完成,逐一实现。无论业绩如何,无论生态如何,市场都需要一个没有NVIDIA的第二选择。这是地缘政治带来的非凡结构性机遇。
构建生态系统成本高昂。每一次亏损都是真金白银的投入,追随CUDA生态。学习成本、软件补贴、工程师出差解决编译问题的费用。这些亏损并非运营不善,而是建立自主生态的必要“战时税”。这三份业绩报告更真实地反映了“算力战”的局势,而非任何行业的成功庆典。这不是欢庆的胜利,而是血战——士兵在流血中崛起。
但战争的形式真正改变了。八年前,我们还在讨论“我们能否生存”。现在,讨论的是“我们必须付出什么代价才能生存”。代价本身就是进步。