互联网

阿里通义千问发布小尺寸模型Qwen3-4B,性能超越GPT4.1-Nano

来源:TechWeb 作者:Suky 2025-08-07 21:18:30 我要评论

阿里通义千问今日宣布,其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经

阿里通义千问今日宣布,其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。

新模型在非推理领域表现出色,Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano,并在性能上接近中等规模的Qwen3-30B-A3B(non-thinking)。在推理领域,Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B(thinking)相媲美。

官方指出,2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署,这将使得手机等移动设备能够高效地运行这些模型。

Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升,不仅超越了商业闭源的小尺寸模型GPT-4.1-nano,而且在性能上接近Qwen3-30B-A3B(non-thinking)。新模型还覆盖了更多语言的长尾知识,并在主观和开放性任务中增强了人类偏好对齐,能够提供更符合人们需求的答复。此外,模型的上下文理解能力扩展至256K,使得小模型也能够处理长文本。

Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增强,AIME25得分高达81.3分,推理表现可以媲美Qwen3-30B-Thinking模型。特别是在AIME25测评中,该模型在数学能力方面表现出色,以4B参数量获得了81.3分的高分。此外,该模型的Agent分数也非常突出,相关评测均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景,为用户提供更加丰富的应用体验。
 

 

转载请注明出处。

本站页面、图片和视频等资料部分由互联网编辑生成,版权归原创者所有,本网站只提供web页面服务,并不提供资源存储,若本站收录的页面无意侵犯了贵司版权,请 联系我们

网友点评
0相关评论