本报讯 (记者梁傲男)7月30日,记者从北京智谱华章科技股份有限公司(以下简称“智谱”)获悉,智谱发布的新一代旗舰模型GLM-4.5登顶HuggingFace Trending榜单。

智谱/供图
据记者了解,GLM-4.5参数量为DeepSeek-R1的二分之一、Kimi-K2的三分之一,但在多项标准基准测试中表现得更好,得益于模型更高的参数效率。在性能优化之外,GLM-4.5系列也在成本和效率上实现突破:API调用价格低至输入价格为0.8元/百万tokens,输出价格2元/百万tokens,大幅低于目前主流的模型定价。
在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。
智谱方面表示,大语言模型的目标是在广泛领域达到人类认知水平,而非针对特定任务而设计专家模型。一个优秀的大语言模型必须具备通用问题解决、泛化能力、常识推理和自我改进等核心能力。过去五年里,OpenAI的GPT-3学会了常识知识,而o1模型则通过强化学习实现了“先思考后回答”,在编程、数据分析和复杂数学问题上的推理能力得到了显著提升。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。
目前,智谱GLM-4.5模型系列已上线超算互联网AI社区,包括GLM-4.5和GLM-4.5-Air的基础模型、混合推理模型以及混合推理模型的FP8版本。企业和开发者均可在AI社区快速下载模型文件进行部署、微调开发。
(编辑 郭之宸)