本报讯 (记者李乔宇)4月24日,昆仑万维科技股份有限公司(以下简称“昆仑万维”)宣布正式开源多模态推理模型的全新升级版本——Skywork-R1V2.0(以下简称“R1V2.0”)。
昆仑万维披露的公告显示,Skywork-R1V2.0是当前最均衡兼顾视觉与文本推理能力的开源多模态模型,该多模态模型在高考理科难题的深度推理与通用任务场景中均表现优异,实现多模态大模型的“深度+广度”统一。
据悉,升级后的R1V2.0模型理科学科题目(数学、物理、化学)推理效果拔群,能够成为免费AI解题助手;38B权重+技术报告全面开源,推动多模态生态建设;能够实现多模态奖励模型(SkyworkVLReward)与混合偏好优化机制(MPO),全面提升模型泛化能力;选择性样本缓冲区机制(SSB),突破强化学习“优势消失”瓶颈。
据介绍,在多个权威基准测试中,R1V2.0相较于R1V1.0在文本与视觉推理任务中均实现显著跃升。无论是专业领域任务,如数学推理、编程竞赛、科学分析,还是通用任务,如创意写作与开放式问答,R1V2.0都呈现出极具竞争力的表现。
为实现多模态大模型在“深度推理”与“通用能力”之间的最佳平衡,R1V2.0引入了全新的“多模态奖励模型Skywork-VLReward”及“规则驱动的混合强化训练机制”,在显著增强推理能力的同时,进一步稳固了模型在多任务、多模态场景中的稳定表现与泛化能力。
(编辑 张明富)