证券日报微信

证券日报微博

您所在的位置: 网站首页 > TMT频道 > TMT行业 > 正文

智谱联合华为开源首个国产芯片训练的多模态SOTA模型

2026-01-14 08:30  来源:证券日报网 

    本报讯 (记者梁傲男)1月14日,智谱联合华为开源新一代图像生成模型GLM-Image,模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个全程在国产芯片上完成训练的SOTA多模态模型。

8RUK)@XX7U~[[`B$QFC$9CQ.png

    智谱/供图

    据记者了解,GLM-Image采用自主创新的“自回归+扩散解码器”混合架构,实现了图像生成与语言模型的联合,是智谱面向以NanoBanana Pro为代表的新一代“认知型生成”技术范式的一次重要探索。

    智谱方面表示,“GLM-Image是我们对国产计算生态的一次深度探索与验证。依托昇腾NPU和昇思MindSpore AI框架,使用动态图多级流水下发、高性能融合算子、多流并行等特性,我们自研了模型训练套件,全面优化数据预处理、预训练、SFT和后训练的端到端流程。通过动态图的多级流水优化机制,将Host侧算子下发的关键阶段流水化并高度重叠,消除下发瓶颈;通过多流并行策略,通信和计算互掩,打破文本梯度同步、图像特征广播等操作的通信墙,极致优化性能;使用AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子,同步提升训练的稳定性和性能。”

(编辑 李家琪)

-证券日报网
  • 深度策划

版权所有《证券日报》社有限责任公司

互联网新闻信息服务许可证 10120240020增值电信业务经营许可证 京B2-20250455

京公网安备 11010602201377号京ICP备19002521号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

官方客户端

安卓

IOS

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注