证券日报微信

证券日报微博

您所在的位置: 网站首页 > 公司产业 > 上市公司 > 正文

智谱公布GLM-5底层基础设施重大工程进展:系统吞吐量最高提升132% 修复方案获SGLang开源社区采纳

2026-04-30 09:33  来源:证券日报网 

    本报讯 (记者梁傲男)4月30日,北京智谱华章科技股份有限公司(以下简称“智谱”)发布技术报告《ScalingPain:超大规模CodingAgent推理实践》,首次系统披露GLM-5系列模型在超大规模CodingAgent调用场景下的底层推理技术突破。

    报告显示,经底层工程优化,GLM-5系列在CodingAgent场景下的系统吞吐量最高提升132%,系统异常输出率从万分之十几下降至万分之三以下。相同硬件条件下服务能力显著扩容。KVcache修复方案获SGLang开源社区采纳,惠及全球基于SGLang部署模型的厂商。

    据悉,公司推理优化还在进一步加速,以大幅提升单位算力token吞吐效率,并降低推理成本。

    在业内看来,本次披露在三个层面具有资本市场含义。一是直接指向单位推理成本结构改善。系统吞吐量10%-132%的提升意味着相同硬件条件下服务能力的显著扩容,公司推理优化还在进一步加速,对单位Token推理成本与毛利率提升构成直接利好。

    二是验证CodingAgent商业化领先地位。GLMCodingPlan发布以来,智谱已成为国内CodingToken调用规模最大的厂商之一,日均数亿次的CodingAgent调用规模为本次工程突破提供了真实负载基础,这也使工程团队得以最先定位并修复CodingAgent时代的底层基础设施问题,产生先发优势。

    三是基础设施能力获第三方验证。智谱本次披露的工程突破具备明确的技术深度——团队不仅在自有推理链路中定位并修复了PD分离架构下的KVCache跨节点复用竞态,更进一步在主流开源推理框架SGLang的源代码层面发现并修复了HiCache模块的加载时序缺失问题,修复方案被SGLang开源社区采纳,其底层基础设施能力不仅服务于自身模型,也正在成为大模型行业的公共基础设施之一。

    以下为技术报告。

    

(编辑 郭之宸)

-证券日报网
  • 24小时排行 一周排行

版权所有《证券日报》社有限责任公司

互联网新闻信息服务许可证 10120240020增值电信业务经营许可证 京B2-20250455

京公网安备 11010602201377号京ICP备19002521号

证券日报网所载文章、数据仅供参考,使用前务请仔细阅读法律申明,风险自负。

证券日报社电话:010-83251700网站电话:010-83251800

网站传真:010-83251801电子邮件:xmtzx@zqrb.net

官方客户端

安卓

IOS

官方微信

扫一扫,加关注

官方微博

扫一扫,加关注