本报记者李雯珊 见习记者张美娜
6月8日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》(国数科基〔2026〕25号)(以下简称《方案》),这是国家层面首次对数据赋能人工智能发展作出的系统性部署。《方案》提出,促进数据标注产业链上下游紧密协同,形成产业集聚效应。培育一批数据标注龙头企业、独角兽企业、瞪羚企业,壮大数据标注产业。
利好政策不断
公开资料显示,数据标注是指对文本、图像、语音等原始数据进行加工,通过添加标签将其转化为机器学习算法可识别、可利用的训练数据的过程。
业内人士表示,近年来,一系列支持政策陆续发布,支持数据标注产业发展壮大。在国家层面,2025年1月份,国家发展改革委、国家数据局等部门联合印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业,打造一批产学研用联动的创新载体,建设一批成效明显、特色鲜明的数据标注基地,形成相对完善的数据标注产业生态,构建创新要素聚集、产业链上下游联动、区域协同发展的新格局。
在地方层面,广西、四川等地在今年相继印发《广西深入实施“人工智能+”三年行动方案(2026—2028年)》《关于支持数字经济高质量发展的若干政策措施》,支持数据产业发展。
从产业规模来看,据央视新闻报道,预计到2030年,我国数据产业规模将达到7.5万亿元。中关村物联网产业联盟副秘书长袁帅在接受《证券日报》记者采访时表示,数据标注产业凭借为机器学习模型提供精准训练数据、有效提升模型识别准确率以及优化模型性能等作用,成为人工智能产业发展的核心支撑领域。此外,智能标注工具、垂直领域数据集建设等方面取得显著突破,数据要素市场生态持续完善,数据标注及数据服务产业链相关企业迎来发展新机遇。
根据国家数据局在今年4月份发布的《全国数据资源调查报告(2025年)》,2025年,全国年度数据生产总量达52.26泽字节(ZB),同比增长27.28%,增速较上年提升2.28个百分点。我国数据生产总量占全球约27.44%。从主体看,企业成为数据生产的主力,数据生产增量约九成来自企业数据,产业数智化转型成效明显。
上市公司抢滩新赛道
近年来,随着政策红利持续释放,市场对数据标注产业的关注度持续提升,相关企业积极抢抓市场机遇,纷纷加码布局。
世纪恒通近日在接受机构调研时表示,公司在业务上,主攻高附加值的数据标注、数据服务等赛道,扩大在自动驾驶、AI大模型、具身智能等前沿应用领域的服务占比。在技术层面,公司加大研发投入,运用AI预标注、智能质检、自动化流程管理等工具提升运营效率,持续提升整体自动化与智能化水平。
天眼查App显示,广东天亿马信息产业股份有限公司(以下简称“天亿马”)近日与汕头华侨试验区直属国有独资平台汕头市东海岸投资建设有限公司共同出资设立广东天亿马数据产业有限公司。据天亿马官网介绍,该合资公司以数据标注为核心业务,全面开展图像、文本、语音、视频等多类型数据的标注、清洗、整理及合规咨询服务,致力于打造高标准、规模化的汕头“数据标注基地”。同时,依托华侨试验区“来数加工”政策红利与跨境数据通道优势,该合资公司将积极拓展跨境数据标注、数据合规咨询等增值服务,聚焦“外数中算”“外数中储”等创新模式,助力跨境数据要素安全有序流动,构建数据产业全链条服务能力。
国研新经济研究院创始院长朱克力向《证券日报》记者表示,在政策持续赋能下,数据标注产业迈入全新发展阶段。行业逐步摆脱传统纯人工作业模式,向智能化、自动化方向转型,依托AI技术全面提升作业效率与服务品质。同时,产业不断延伸价值链条,从基础数据加工转向高附加值服务,深度赋能大模型、智能驾驶等前沿应用。伴随各地数据试点、跨境数据相关政策落地,行业合规建设持续加强,跨境数据服务成为新的增长亮点。整体来看,规模化运营、技术升级、合规发展,将成为行业长期发展的核心主线。
(编辑 才山丹)