本报讯 (记者袁传玺)3月20日,上海阶跃星辰智能科技有限公司(以下简称“阶跃星辰”)发布开源图生视频模型Step-Video-TI2V,该模型是基于30B参数Step-Video-T2V训练的图生视频模型,支持生成102帧、5秒、540P分辨率的视频,模型效果在图生视频领域权威基准测试VBench-I2V中达到State-of-the-Art(SOTA)水平(即当前最先进的模型)。该模型上线后已迅速与华为昇腾计算平台完成适配,目前在阶跃AI网页版、App端和魔乐社区(Modelers)都可体验。
阶跃星辰公众号介绍,Step-Video-TI2V图生视频开源模型具备运动幅度可控和镜头运动可控两大核心特点。其运动幅度可控能力,能够平衡图生视频生成结果的动态性和稳定性,为创作者提供更为灵活的选择。在运镜方面,从基本的推拉摇移、升降,到各种复杂的电影级运镜效果都能驾驭。另外,Step-Video-TI2V天生具备一定的特效生成能力,并可以自由选择多种图生视频的尺寸。在动漫类任务上,Step-Video-TI2V的效果尤其突出,非常适合用于动画创作、短视频制作等应用场景。
据了解,这是最近一个月阶跃星辰开源的第三款多模态大模型,此前阶跃星辰开源了Step-Video-T2V文生视频模型和Step-Audio语音模型,两款均达到了State-of-the-Art级别,阿里云、火山引擎、天数智芯、LiblibAI、TCL等生态厂商均快速接入。开源图生视频模型,被视为阶跃星辰在多模态开源领域发挥生态影响力的又一动作。
(编辑 张昕 贺俊)