今日,智谱AI宣布,其与华为联合开源的新一代图像生成模型GLM-Image,在开源上线不到24小时内,便一举登上全球知名AI开源社区Hugging Face(抱抱脸)的榜单全球第一。
智谱AI表示,这是国际上首次由完全依托国产芯片训练的模型斩获榜首,标志着国产AI模型在端到端自主研发能力上取得了重大突破,成功跻身全球竞争前列。
据悉,GLM-Image是基于华为昇腾Atlas 800T A2训练设备及昇思MindSpore AI框架,完成了从数据处理到模型训练的全流程开发。这使得GLM-Image成为首个在国产芯片上完成全程训练的SOTA(当前最佳)多模态大模型,验证了国产AI算力生态的成熟度。
在模型架构设计上,GLM-Image摒弃了开源界常用的LDM方案,创新性地采用了自回归与扩散解码器相结合的混合架构。这种设计有效兼顾了对全局指令的深度理解和对局部细节的精细刻画。
性能表现方面,GLM-Image在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)两个权威榜单上均斩获开源世界第一。模型不仅能精准读懂指令,还能准确书写文字,尤其在汉字生成任务上表现优异,可广泛应用于海报设计、PPT制作、科普图解等知识密集型场景。
在商业化落地层面,GLM-Image展现了极高的性价比。在API调用模式下,单张图片的生成成本仅为0.1元。这一价格大幅降低了企业和开发者使用先进图像生成技术的门槛,有助于加速AI视觉技术在各行各业的应用普及。
转载请注明出处。

相关文章
精彩导读
热门资讯
关注我们