证券日报微信

证券日报微博

您所在的位置: 网站首页 > 公司产业 > 上市公司 > 正文

商汤发布NEO架构 重新定义多模态模型效能边界

2025-12-02 13:47  来源:证券日报网 

    本报讯 (记者李乔宇)近期,商汤集团股份有限公司(以下简称“商汤”)正式发布并开源了与南洋理工大学S-Lab合作研发的全新多模态模型架构——NEO,为日日新SenseNova多模态模型奠定了新一代架构的基石。

    作为行业首个可用的、实现深层次融合的原生多模态架构(NativeVLM),NEO从底层原理出发,打破了传统“模块化”范式的桎梏,以“专为多模态而生”的创新设计,通过核心架构层面的多模态深层融合,实现了性能、效率和通用性的整体突破,重新定义了多模态模型的效能边界,标志着人工智能多模态技术正式迈入“原生架构”的新时代。

    当前,业内主流的多模态模型大多遵循“视觉编码器+投影器+语言模型”的模块化范式。这种基于大语言模型(LLM)的扩展方式,虽然实现了图像输入的兼容,但本质上仍以语言为中心,图像与语言的融合仅停留在数据层面。这种“拼凑”式的设计不仅学习效率低下,更限制了模型在复杂多模态场景下(比如涉及图像细节捕捉或复杂空间结构理解)的处理能力。

    商汤NEO架构正是为了解决这一痛点而生。早在2024年下半年,商汤便在国内率先突破多模态原生融合训练技术,以单一模型在SuperCLUE语言评测和OpenCompass多模态评测中夺冠,并基于这一核心技术打造了日日新SenseNova 6.0,实现多模态推理能力领先。之后,公司在2025年7月份发布日日新SenseNova 6.5,通过实现编码器层面的早期融合,把多模态模型性价比提升3倍,并在国内率先推出商用级别的图文交错推理。商汤此次更进一步,彻底摒弃了传统的模块化结构,从底层原理出发,推出了从零设计的NEO原生架构。

    目前,商汤已正式开源基于NEO架构的2B与9B两种规格模型,以推动开源社区在原生多模态架构上的创新与应用。商汤表示,致力于通过开源协作与场景落地双轮驱动,将NEO打造为可扩展、可复用的下一代AI基础设施,推动原生多模态技术从实验室走向广泛的产业化应用,加速构建下一代产业级原生多模态技术标准。

(编辑 张伟)

-证券日报网

版权所有《证券日报》社有限责任公司

互联网新闻信息服务许可证 10120240020增值电信业务经营许可证 京B2-20250455

京公网安备 11010602201377号京ICP备19002521号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

官方客户端

安卓

IOS

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注