4月25日消息,2026年4月24日,全球AI行业迎来一场戏剧性的“同框”。北京时间凌晨,OpenAI正式发布旗舰模型GPT-5.5;当天上午,来自杭州的DeepSeek也打出手中的牌,V4系列模型预览版正式上线并同步开源。
DeepSeek-V4此次推出两个版本:旗舰版V4-Pro,参数规模达1.6万亿(激活参数49B);性价比版V4-Flash,参数规模284B(激活参数13B)。两者均原生支持100万token超长上下文,采用开源的MIT协议。
这不是DeepSeek第一次让全球注视。2025年初,其前代模型R1曾冲上美国App Store榜首,引发美股AI板块剧烈震荡。时隔15个月,V4的到来再度将这家中国AI公司推到聚光灯下。
权威评测:意料之中的强,意料之外的快
V4发布当日下午至晚间,第三方评测数据陆续出炉,核心结论可概括为:代码能力惊艳、推理逼近前沿、算力尚需补课。
在代码领域,V4展现出了不亚于任何竞争对手的实力。Vals AI的Vibe Code Benchmark测试中,V4以“压倒性优势”拿下开源权重模型第一名,击败Gemini 3.1 Pro等闭源前沿模型,较前代V3.2实现约10倍的性能跃升。Arena.ai在X上宣布,V4 Pro思考模式在其代码竞技场中列开源模型第3位、综合排名第14位,定性为“相较DeepSeek V3.2的重大飞跃”。
有用户直接在X上喊话:“GPT-5.5,对不起,DeepSeek V4才是新的震撼时刻,它在代码竞技场中击败了GPT-5.4高强度模式”。
国际权威机构的评测同样印证了这一点。据OfficeChai引用的技术报告,V4-Pro-Max在LiveCodeBench上以93.5的得分超过GPT-5.4(91.7)和Gemini-3.1-Pro(89.2),在Codeforces人类选手排行榜上排名第23位。
数学能力方面,V4同样可圈可点。在竞赛数学基准HMMT 2026 Feb中,V4-Pro-Max为95.2,与Opus-4.6 Max的96.2及GPT-5.4的97.7差距极小;Apex Shortlist得分90.2,超过同场对比的所有模型。
不过,短板也同样清晰。在反映深度知识掌握水平的SimpleQA-Verified上,V4-Pro得分为57.9,而Gemini-3.1-Pro高达75.6,差距明显。在HLE(高难度推理任务)上,37.7对比Gemini的44.4,仍有近7个百分点的距离。
DeepSeek官方自身的评估颇为克制:V4-Pro的知识与推理能力已超越主流开源模型,接近Gemini等闭源系统,但与最先进的前沿模型仍存在约3至6个月的差距。在数学和STEM方面V4进度最快,在知识和事实检索方面差距最远,这一点得到了国际媒体的广泛认可。
开发者与用户:惊艳与冷静并行
V4上线的第一时间,全球开发者社区几乎同步开机测评,呈现出“技术认可”与“差距共识”并存的双重态度。
在中文社区,V2EX和知乎用户高度聚焦V4的编程Agent能力和低价策略,早期反馈显示Pro版已接近Claude Opus 4.6水平,但在复杂深度推理任务上仍有差距。智东西团队进行了一项耗时耗资的大规模实测,累计消耗超过1000万token。结果令人印象颇深:V4-Pro能够连续自主编程60分钟以上,无需人工干预即完成复杂的数据库设计和安卓模拟器开发等工程任务,展现出了强大的长程规划、自我纠错和工具调用能力。但在轻量级问题上,V4-Pro有时因为“过度思考”反而无法给出正确答案,而Flash版表现更加直接高效。
在美国开发者社区,Replit CEO Amjad Masad给予了高度评价,称赞V4的注意力压缩和长上下文效率提升是“真正的架构创新”。然而,Hacker News和Reddit上,多数开发者采取了“观望”姿态。美国外交关系委员会研究员Chris McGuire发文称,V4报告自身承认落后前沿模型3到6个月,他同时质疑训练芯片的透明度。对此,Replit的Masad予以回击,认为美国政客在渲染“中国蒸馏恐慌”的同时,中国科学家却在真诚分享真正的AI突破,V4的架构创新与训练数据蒸馏完全无关,开源使所有人都能受益。
普通用户的反馈则更为分化。有X用户赞叹:“中国正在主导AI,他们已经追上来了。DeepSeek V4 Flash每百万token仅需0.28美元,代码竞技场排名第一。”但也有用户表达了失望,有X用户试用后认为,V4 Flash的实际体验未能超越此前已相当成熟的V3.2,对老用户而言升级体验并不理想。
定价方面,V4-Flash输出价格约为每百万token 0.3美元(2元人民币),较Claude Opus 4.7低逾99%;V4-Pro输出价格约为3.5美元,在前沿模型中同样极具竞争力。
整体而言,国产模型比海外模型平均便宜约60%。但此前DeepSeek被认为是“价格屠夫”,这次V4-Pro的价格相较于前代实际上有所上调,有媒体评论称这“有点对不起DeepSeek一直以来的价格屠夫称号”。
股市剧烈波动
V4发布的消息,率先在A股市场引爆。
4月24日上午,V4上线消息一经传出,DeepSeek概念股应声大涨。皖通科技7分钟内由跌转涨、直线封板。浙数文化亦由跌拉起,快速涨停。截至24日收盘,海光信息上涨8.2%,星华新材上涨19.99%,众合科技、日海智能均上涨10.05%,润和软件上涨9.48%。港股芯片股同样全线爆发,华虹公司大涨12.31%,中芯国际涨10.01%。
A股大涨背后有一条清晰的投资叙事:DeepSeek-V4全面适配华为昇腾等国产芯片,打破了以往对英伟达CUDA生态的依赖,被市场解读为国产芯片从“可用”走向“好用”的关键信号。英伟达CEO黄仁勋此前曾毫不避讳地指出,一旦DeepSeek率先在华为平台上实现深度优化并发布,“对美国将是一个可怕的结果”。
券商机构也快速跟进。中信证券研报预计,Agent和多模态等应用爆发将驱动Token调用量井喷,2026年国产算力芯片出货量至少实现翻倍以上增长。山西证券指出,DeepSeek-V4等国产大模型的适配,将带动国产芯片从通信芯片到超节点交换芯片的全链路需求。
写在最后:不只是一场发布
DeepSeek-V4的发布,对行业而言至少传递了三个清晰信号。
其一,开源追闭合的步伐比许多人预想的更快。V4在代码和数学等领域已经与顶尖闭源模型针锋相对,部分指标甚至领先。虽然“3到6个月”的差距依然存在,但在开源阵营内,V4已确立了无可争议的领军地位。
其二,国产芯片生态正在形成正反馈闭环。V4从训练到推理深度适配华为昇腾,证明了不依赖英伟达也能造出世界级大模型。这不仅提振了国产算力板块股价,更重要的是完成了一次技术可信度的背书。
其三,DeepSeek正在从“孤胆英雄”走向更复杂的新阶段。伴随V4发布的消息,DeepSeek首轮融资的消息也浮出水面,其估值超过200亿美元,传腾讯、阿里正洽谈投资。面对人才流失、资金压力和产业竞争的加剧,技术只是故事的一半,另一半将取决于组织能力和商业化节奏。
V4发布时,DeepSeek在官方公众号写了一段“写在后面的话”: “不诱于誉,不恐于诽,率道而行,端然正己”,这句荀子的古训,也许是对这场全球围观的最贴合回应。在被聚光灯反复扫射的时代,保持定力比追逐聚光灯更难,也更有力量。
转载请注明出处。

相关文章
精彩导读
热门资讯
关注我们