本报讯 (记者金婉霞)4月10日,智元创新(上海)科技股份有限公司(以下简称“智元”)推出了世界模型的迭代版本Genie Envisioner World Simulator2.0(GE-Sim 2.0)。据介绍,GE-Sim 2.0能够响应机器人动作信号、支持分钟级长时序稳定推演并内置了激励模型,可以让机器人基于文本对生成状态自动评估与优化,完成强化学习。智元表示,这意味着,该模型首次构建出了可交互、可训练、可评估的“物理进化引擎”,可以让机器人在世界中学习、成长、进化。
资料显示,2025年,智元发布了行业首个世界模型开源平台Genie-Envisioner,希望通过视觉、语言与动作的统一建模,让机器感知环境、读懂指令、做出反应。此次推出的迭代版本,在原有版本的基础上,进一步强化了世界模型对于“动作”变量的理解能力,将“状态—动作—状态演化”作为统一建模对象。智元认为,世界模型不只是描述世界,而是要成为一个可以被使用、被交互、被训练的世界本身。“如果一个足够高质量的世界模型被构建,那么在这个生成的世界中行动的策略也可以被更有效地训练。”智元表示,同时训练数据也会更具规模性与多样性。
此外,智元同步推动了世界模型向可交互的模拟器的演进:引入动作条件化世界建模,使模型能够基于动作进行未来推演;构建可用于策略闭环评估的神经模拟器;并从场景一致性、动作正确性与语义对齐等多个维度,对世界模型的模拟能力进行系统评估等。
智元方面表示,具身智能的长远未来,在于拥有自主学习与持续进化的能力,这份进化,既来自对真实世界的观察与沉淀,更来自模型世界里无限的推演、试错与成长可能。当模型成为可交互、可训练、可进化的完整世界,现实将不再是机器人唯一的训练场,“我们希望这一技术升级能成为具身智能发展史上的重要基础设施,推动机器人走向自主探索、持续进化的新阶段,成为具身智能通往通用人工智能过程中的关键能力基石。”
(编辑 黄力)