■田鹏
4月16日,国家统计局副局长毛盛勇在国新办新闻发布会上表示,我国人工智能商业化规模化应用取得阶段性突破,到今年3月份,日均词元调用量突破140万亿,比2025年末增长超40%。
词元作为大模型处理语言、图像的最小计量单位,是连接原始数据与AI应用的核心桥梁。词元调用量直接反映了AI模型的应用频次、覆盖范围与落地深度,是衡量AI产业活跃度的核心指标。
从2024年初的日均1000亿,跃升至如今的140万亿,短短两年间,词元调用量暴涨近1400倍。这一爆发式增长背后,是AI应用在教育、农业、工业、服务业等全场景的深度渗透。
从产业发展看,词元的大规模应用持续推动AI模型快速迭代升级,倒逼数据治理、标注、流通等配套产业链不断完善,推动人工智能从通用化演示向专业化落地跨越,为传统产业数字化、智能化转型注入强劲动力。
从经济价值看,词元作为可计量、可流转、可定价的数据载体,可有效破解原始数据碎片化、难以量化的难题,让数据要素价值可测度、可交易成为现实,为数据要素市场化配置开辟新路径,有力促进数字经济与实体经济深度融合。
值得关注的是,4月15日国家数据局发布的《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》(以下简称《行动方案》)明确提出,“探索词元交易等新型交易模式,构建以词元为基础,可量化、可定价的数据集价值体系”,这一顶层设计,进一步印证了词元在数据要素市场化配置中的重要地位,也为其未来发展指明了方向。
更具现实意义的是,词元驱动的AI规模化应用,正在持续优化生产流程、提升服务效能。从医疗领域的精准辅助诊断,到农业领域的智能种植管理,再到社会治理的智能化升级,词元正通过AI实实在在地提升民生服务质量,推动社会运行更高效、更精细。
当然,词元调用量的爆发式增长,也对产业规范、数据治理与安全保障提出了更高要求。在笔者看来,要想让词元的价值持续释放,不但要确保量的稳定,更要关注质的提升。具体而言,还需在以下四方面持续发力。
一是提高词元质量。如同优质食材决定菜品品质,高质量词元是AI可靠应用的前提。国家数据局在上述《行动方案》中部署“标注攻坚”“提质增效”等专项行动,聚焦重点领域打造高质量数据集,正是破解当前词元质量参差不齐的关键举措。
二是快速打通数据流通渠道。当前,数据仍存在部门分割、行业隔离等“数据孤岛”现象,亟须搭建安全规范的流通平台,完善流转规则,推动词元在各领域合规流动、高效配置。
三是健全词元定价机制。词元价值应与其质量、稀缺性、应用场景紧密挂钩,应通过加快构建科学公允的定价体系,让词元真正实现可交易、可增值,充分激发市场活力。
四是坚持创新与安全并重。一方面持续加强词元处理、模型优化等技术研发,提升应用效率;另一方面完善法律法规与监管体系,规范词元采集、加工、流转、交易全流程,牢牢守住数据安全与隐私保护底线。
词元调用量的爆发式增长,提出了数据治理与价值挖掘的全新课题。未来,随着高质量数据集建设加快推进、词元流通与定价机制不断完善,词元将持续释放乘数效应,推动AI技术深度赋能实体经济,助力我国从AI应用大国稳步迈向AI创新强国。