本报讯 (记者李昱丞)近日,具身智能公司深圳超维动力智能科技有限公司(以下简称“超维动力”)举办“降临GIFTED”发布会,正式发布115个自由度全尺寸人形机器人“KAI”。
KAI的思路是,借助人类的视角和动作来观察世界、接触世界,从而获得更贴近真实场景的经验。超维动力自研规模化数采终端KAIHalo。该设备采用轻量化头环形态,“一芯八摄”,可一站式完成人类世界数据采集,不仅能够记录第一人称视角视频,还能完成人体姿态与场景点云重建。由于设备足够轻便,佩戴者可以在日常工作中自然使用,这意味着采集过程不需要依赖脚本化编排,数据也更接近真实场景。相比刻意设计的动作流程,这类数据往往能记录更多样的动作,更适合人形机器人训练。
据介绍,目前超维动力的世界模型系统已形成闭环结构,除主体模型外,系统还包括动作模块和评估模块。动作模块会根据当前状态生成候选动作,并传递给基模型;基模型再根据候选动作,生成未来状态;评估模块则对轨迹进行价值判断,包括任务进展、是否安全接触等。
世界模型让KAI理解世界,第一人称数据集让KAI拥有了“人类经验”,但还需要一个好的训练范式让KAI把经验转化为技能,这就是三阶段训练体系。
在预训练阶段,KAI使用大量互联网和仿真等数据,并通过自采的第一人称视角数据去补充全身与环境交互的语义信息,为KAI构建起“空间-语言-视觉-任务动作”对齐的“常识”。在桥接训练阶段,采用UMI和数采手套等数据,去补足预训练阶段精细手部动作和物理接触的缺失。在后训练阶段,引入具体场景的真机遥操数据,进而解决与本体对齐的问题。
有了数据和大脑,最后一步则是要有一个承载能力的身体,也就是高拟人本体,让它可以自然融入人类日常,并安全地与人交互。这也就是KAI的身体——KaiBot。据介绍,KAI的高拟人本体能力可以概括为体型拟人、体格拟人、体能拟人和感知拟人四个层面。在体格上,KaiBot具有115个自由度,接近人体的全身运动空间,也更接近人类肢体在复杂环境下的自然使用方式。同时,KaiBot配备了单手36个自由度的灵巧手,不仅可以承担抓握、捏取等精细操作,也能缓冲碰撞,呈现更安全、更自然的交互特性。同时,其定制化柔顺执行器不仅帮助机器人实现更接近人体的运动柔顺性,也使双臂负载接近20kg,兼顾交互友好性与作业能力。
(编辑 张文玲)