值得买与中国人民大学高瓴人工智能学院联合取得AIGC研究成果

2025-06-12 13:59 来源：证券日报网

本报讯（记者桂小笋）6月11日至6月15日，2025国际计算机视觉与模式识别会议（CVPR2025）召开。北京值得买科技股份有限公司（以下简称“值得买”）与中国人民大学高瓴人工智能学院在多模态领域的最新联合研究成果《图像转有声视频》（《Animate and Sound an Image》）成功入选。

该成果首次提出了一种从静态图像直接生成同步音视频内容的生成框架JointDiT（Joint Diffusion Transformer），实现了从图像到“动态视频+声音”的高质量联合生成。这不仅展现了双方在AIGC领域的技术创新突破，也为AI多模态的高质量发展提供了新的思路与启发。

据介绍，《图像转有声视频》首次提出并系统定义了图像到有声视频生成（Image-to-Sounding-Video，I2SV）这一新任务：让静态图像“动”起来的同时，生成与之语义匹配、时间同步的音频内容。同时还提出了一种新颖的内容生成框架JointDiT（Joint Diffusion Transformer），并具体阐述了如何利用两个强大的单模态预训练扩散模型（一个视频生成器，一个音频生成器），构建统一的联合生成框架，实现多模态协同生成。

人大高瓴人工智能学院长聘副教授宋睿华表示：“接下来，研究团队计划将JointDiT扩展至图像、文本、音频、视频四模态的联合建模，为构建更通用、更智能的多模态生成系统奠定基础。”

（编辑何成浩郭之宸）

-证券日报网

热点新闻

春节黄金市场面面观：有人排队采购有人卖出离场

过新年换新钱银行从“保供应”到“精准服务”

一栋办公楼的“第二次生长”——北京“商改保”样本调研

全球汽车巨头Stellantis“栽跟头”带来哪些警示

24小时排行一周排行

深度策划

新一轮以旧换新落地激发消费新动能

首先，一些地方在出台与消费品以旧换新相关的……[详情]

市场快讯

23:29	A股公司积极参设产业并购基金
23:29	商业航天领域投融资活跃星际荣耀...
23:29	多家锂电企业锚定市场需求优化产能...
23:29	潍柴点亮“电动力”
23:29	乳山：小牡蛎撬动大经济
23:29	看京沈两地券商将金融服务融入民生...
23:29	新能源汽车迎春运“大考”：力保充...
23:22	银行保险机构权益投资信心指数显著...
23:22	券商交易结算系统压力测试“再升级...
23:22	商业银行2025年累计实现净利润2.4...
23:22	车贷“长跑”开启汽车金融驶入共...
23:21	地方密集布局人工智能产业千行百...

互联网新闻信息服务许可证 10120240020增值电信业务经营许可证京B2-20250455

京公网安备 11010602201377号京ICP备19002521号

证券日报网所载文章、数据仅供参考，使用前务请仔细阅读法律申明，风险自负。

证券日报社电话：010-83251700网站电话：010-83251800

网站传真：010-83251801电子邮件：xmtzx@zqrb.net