本报讯 (记者王镜茹)12月2日,在2025GIS全球创新峰会现场,深圳云天励飞技术股份有限公司(以下简称“云天励飞”)董事长兼CEO陈宁与深度学习奠基人Geoffrey Hinton,围绕算力效率、AI向善与普惠未来展开对话,由硅谷著名计算机科学家、硅谷高创会大会主席吴军主持。

AI推理芯片将被广泛应用
在算力成本急剧攀升的今天,AI真正瓶颈在哪里?Hinton认为,现有计算体系在能耗和效率上面临越来越大的压力,未来需要在新的计算形态上进行更多探索。
他提到,模拟计算、类脑芯片以及基于类器官的计算等方向,在理论上有望在功耗和通信能力上展现出明显优势。不过,他也明确表示,目前基于脑细胞类器官的计算研究仍处于非常早期的阶段,还不足以承担大规模AI负载,这条路仍然需要时间和长期投入来验证。
陈宁则从工程一线给出回应。他表示,GPU在深度学习早期扮演了重要角色,但本质仍是通用计算架构,并非为神经网络量身定制。“进入大模型和智能体时代,我们要回答的问题不再是能不能训出来,而是在多大能耗和成本下,让多少人用得起。”
陈宁判断,到2030年,全球AI芯片产业规模有望达到约5万亿美元,其中训练芯片约占1万亿美元,而面向终端与行业侧的推理/处理芯片有望达到4万亿美元,占比约80%。随着智能体能力持续下沉,AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电以及各类企业设备之中,像水、电、燃气一样,无处不在、按需取用。
谈到AI的长远影响,Hinton明确表示,如果可以回到2012年,他仍会推动相关研究,但会更早、更大声地提醒世界:AI风险是真实且需要前置应对的。
陈宁则从“谁真正受益”的角度,为“AI向善”加上了另一半定义。他表示,如果AI只停留在少数科技巨头的数据中心,只服务少部分机构和高净值人群,再完美的技术也难言“向善”。真正有意义的AI,必须让更多人用得起、用得上——当AI的使用成本被拉低到接近水电气这种基础设施的水平时,偏远地区的学生、基层医院和中小企业才有可能在教育、医疗、农业与生产中真正获得增益。
云天励飞推动GPNPU架构创新
2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段。
目前,云天励飞以NPU为核心,将推出GPNPU(General-PurposeNeural Processing Unit)架构,走“推理优先架构”路线,在矩阵/向量单元、存储层级和带宽利用上深度优化,目标是实现推理效率百倍级提升。
陈宁认为,“推理异构化”已成为行业趋势。“AI处理任务时,需求理解(Prefill阶段)需高算力支撑,答案生成(Decode阶段)则依赖高带宽,单一芯片难以兼顾所有场景。未来,多模型混合应用将成为常态,这就要求芯片架构具备灵活调配算力、带宽与存储配比的能力。”
对此,云天励飞给出了算力新路径:即在四代NPU的基础上,研发第五代GPNPU架构。核心路径是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新,聚焦提升资本开支Token转化率与运营开支Token转化率,通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”。
架构创新是国产芯片差异化突破的关键。陈宁预判,未来数万亿美元规模的推理芯片市场,核心竞争力将聚焦于架构的灵活适配能力,中国企业在这一领域的技术探索已占据先发优势。
此外,陈宁也呼吁建立全球统一的推理算力网络标准。他介绍,云天励飞已向国际相关机构提出建议,希望推动建立统一的AI推理计算网络标准,让不同国家和地区都能在同一张互联互通的推理网络上共享能力,尤其在医疗与教育等关乎民生的领域真正实现“AI for All”。
面对推理芯片领域的竞争,云天励飞机会在哪里?陈宁认为,其一,公司从2005年就参与并行计算指令集与芯片架构设计,掌握了算法芯片化的第一性原理,可根据算法演进优化指令集,实现软硬结合的高性价比设计;其二,沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才;其三,粤港澳大湾区拥有全球最完善的人工智能与机电一体化产业链,深圳的芯片设计、硬件制造、供应链与营销网络,能第一时间洞察应用变化,以市场需求驱动芯片研发。
(编辑 郭之宸)