11月20日消息,日前,安谋科技Arm China正式推出新一代NPU IP“周易”X3,作为公司“All in AI”产品战略下的首款重磅产品,“周易”X3基于专为大模型设计的最新DSP+DSA架构,在性能、能效与软件生态方面实现全面突破,致力于为基础设施、智能汽车、移动终端、智能物联网等场景打造端侧AI计算效率新标杆。
安谋科技Arm China产品研发副总裁刘浩表示:“在‘All in AI’产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,为生态伙伴提供业界领先的从硬件、软件到服务的端到端解决方案,全力赋能伙伴的产品创新和商业化落地。”
硬件架构全面升级,为大模型量身打造
公开数据显示,“周易”X3采用最新的DSP+DSA架构,专为大模型而生,在计算效率、带宽、精度适配、任务处理四大维度上实现了跨越式提升,精准解决端侧AI大模型运行难题,打造端侧AI计算效率的新标杆,是其“All in AI”战略的硬核体现。
其单Cluster最高支持4个Core,拥有8~80 FP8 TFLOPS算力且可灵活配置,单Core带宽高达256GB/s。相较于“周易”X2产品,“周易”X3的CNN模型性能提升30%~50%,多核算力线性度达到70%~80%。在同算力规格下,AIGC大模型能力较上一代产品实现10倍增长,这得益于16倍的FP16 TFLOPS、4倍的计算核心带宽、超过10倍的Softmax和LayerNorm性能提升共同驱动。
借助这些优化,端侧大模型推理将更高效:在Llama2 7B大模型实测中,“周易”X3 NPU IP在Prefill阶段算力利用率高达72%,并在安谋科技Arm China自研的解压硬件WDC的加持下,实现Decode阶段有效带宽利用率超100%,远超行业平均水平,满足大模型解码阶段的高吞吐需求。
软件平台开放易用,开发效率显著提升
周易”X3搭载全新升级的Compass AI软件平台,实现从模型部署到开发调试的全链路支持:
兼容TensorFlow、PyTorch、ONNX、Hugging Face等主流框架与模型库;
支持超160种算子与270多种模型,覆盖LLM、VLM、VLA、MoE等主流架构;
提供GPTQ量化、动态Shape支持、Token级量化等先进优化手段;
核心组件如Parser、Optimizer、Linux驱动等已开源,支持自定义算子与编译流程,助力开发者实现白盒化部署。
安谋科技Arm China产品总监鲍敏祺指出:“‘周易’X3遵循‘软硬协同、全周期服务与成就客户’的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。”
多场景落地,推动端侧AI普及
新一代“周易”X3 NPU IP将端侧智能的边界拓展至更广阔的应用场景,面向基础设施、智能汽车、移动终端、智能物联网四大领域,精准匹配当前爆发的端侧AI需求。
基础设施:支持加速卡中CNN与大模型的高效推理;
智能汽车:为ADAS自动泊车、IVI智能交互提供高能效AI算力;
移动终端:在AI PC与AI手机中实现超分渲染与AI Agent流畅运行;
智能物联网:在智能IPC、智能网关等设备中实现本地化低延迟推理。
“周易”X3 NPU IP的发布,标志着安谋科技Arm China“All in AI”产品战略的正式开启。安谋科技Arm China以“AI Arm CHINA”为战略发展方向,为千行百业智能化转型提供更强IP“核芯”动力。(御风)
转载请注明出处。

相关文章
精彩导读
热门资讯
关注我们