证券日报微信

证券日报微博

您所在的位置: 网站首页 > 公司产业 > 企业信息 > 正文

智谱发布首个能生成汉字的开源文生图模型CogView4

2025-03-04 16:13  来源:证券日报网 

    本报讯 (记者谢岚见习记者梁傲男)3月4日,北京智谱华章科技有限公司(以下简称“智谱”)发布2025开源年的首个模型——CogView4,这是首个支持生成汉字的开源文生图模型,也是首个遵循Apache2.0协议的图像生成模型。

    记者了解到,CogView4在DPG-Bench基准测试中综合评分排名第一,在开源文生图模型中达到SOTA(最先进的)水平。DPG-Bench(DensePromptGraphBenchmark)是一个用于评估文本到图像生成模型的基准测试,主要关注模型在复杂语义对齐和指令跟随能力方面的表现。

    在业内人士看来,CogView4具有两大技术领先性。

    首先,CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是首个能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5encoder换为具备双语能力的GLM-4encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。

    其次,CogView4支持输入任意长度提示词,能够生成范围内任意分辨率图像,不仅使用户创作更加自由,也提升了训练效率。CogView4模型实现了任意长度的文本描述和任意分辨率图像的混合训练范式。

    智谱相关人士表示:“作为国内最早的开源大模型公司,智谱始终致力于推动AI普惠。2025年是智谱开源年,我们还将陆续开源基础模型、推理模型、多模态模型、Agent模型等。在这片孕育智慧的热土上,我们愿作深扎的根脉,以开源为信仰,以技术为养分,托举AGI之树的参天成长。”

(编辑 郭之宸)

-证券日报网

版权所有《证券日报》社有限责任公司

互联网新闻信息服务许可证 10120240020增值电信业务经营许可证 京B2-20250455

京公网安备 11010602201377号京ICP备19002521号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

官方客户端

安卓

IOS

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注