今年春节档期间,尽管多家国产大模型争相发布,但备受瞩目的DeepSeek V4却暂时缺席。不过,据外媒报道,这一悬念即将揭晓,DeepSeek V4传闻即将问世。
从“模型震撼”到“硬件冲击”:美方警惕新焦点
回顾去年春节档,DeepSeek R1的发布曾令美国AI行业感受到前所未有的寒意,甚至被外界认为是导致英伟达股价暴跌17%的诱因之一。这种“DeepSeek恐惧症”让美国科技界对每一次国产开源AI的发布都如临大敌。
然而,与以往仅停留在算法层面的冲击不同,美国CNBC近日发布了一档长达40分钟的专题视频,题为《China’s next AI shock is hardware》(中国下一次AI冲击是硬件)。该报道指出,DeepSeek V4发布后,其对美国硬件行业的冲击或将远超预期。这标志着中国AI的发展正在从软件层的优势向硬件底层的基础设施延伸。
软硬结合:DeepSeek V4深度适配国产芯片
事实上,DeepSeek V4的“硬件冲击”早有端倪。此前的模型大多依赖英伟达AI卡进行训练,而V4一代将显著加大对国产AI芯片的支持力度。据悉,新模型将在国产芯片上完成训练与推理,并针对华为昇腾及寒武纪思元系列进行了深度优化。
早在DeepSeek V3.1发布时,官方就已透露了关键技术细节——UE8M0 FP8格式,这正是为下一代国产芯片量身定制的设计。相比于传统国产芯片普遍支持的FP16格式,原生FP8支持意味着理论性能翻倍,且大幅降低了对带宽的需求,从而有效压缩成本。此前传闻V4的训练成本仅为对手的1/50,原生FP8的支持功不可没。
华为昇腾Atlas 950:对标英伟达未来旗舰的算力巨兽
在国产AI芯片阵营中,华为昇腾系统无疑是支撑DeepSeek V4冲击硬件行业的基石。随着华为去年公布超节点集群路线图,Atlas 950 SuperPoD系列成为今年的重头戏。
数据显示,Atlas 950超节点集群的规格令人咋舌:
• 规模庞大:支持8192张基于Ascend 950DT的昇腾卡,规模是前代Atlas 900超节点的20多倍。满配包含128个计算柜与32个互联柜,占地面积约1000平方米。
• 性能卓越:总算力实现质的飞跃,FP8算力达到8E FLOPS,FP4算力达到16E FLOPS。
• 互联极速:互联带宽高达16PB/s,这一数字超过当前全球互联网峰值带宽的10倍以上。
全面领先英伟达?国产算力的底气
将Atlas 950与英伟达的旗舰产品对比,更能看清其定位。对比英伟达今年下半年发布的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量达1152TB(是其15倍),互联带宽更是达到16.3PB/s(是其62倍)。
即便是与英伟达计划于2027年上市的NVL576相比,Atlas 950在各项关键指标上依然保持领先态势。这表明,随着DeepSeek V4与华为昇腾等国产硬件的深度磨合,中国AI产业正在构建起一套完全自主可控且具备全球竞争力的软硬件生态体系。(Suky)
转载请注明出处。

相关文章
精彩导读
热门资讯
关注我们