要点:
- 中国国家数据局于6月3日发布了首个系统性的数据驱动AI发展国家框架
- 该计划目标到2028年在包括具身智能和自动驾驶在内的20多个行业部署高质量数据集
- 该框架建立了基于代币的价值体系,并引导国有资本投资数据基础设施
要点:

中国国家数据局发布了首个系统性的数据驱动AI发展国家框架,将2028年设定为全行业高质量数据集部署的最后期限。
中国数据监管机构于6月3日发布了首个系统性的数据驱动人工智能发展国家框架,要求在2028年前完成20多个行业的高质量数据集建设,此举旨在推动AI在消费互联网之外的更广泛应用。
"该计划涵盖了数据集建设的完整链条,从采集、标注到应用和价值实现,"国家数据发展研究院院长胡建波在接受官方媒体采访时表示。"它瞄准了科研、工业制造、低空经济和具身智能等关键及新兴领域。"
这份以国数科技〔2026〕25号文件发布的行计划提出了六大专项行动,涵盖基础拓展、数据标注、质量提升、应用赋能、管理服务和价值释放。该计划要求构建涵盖文本、代码、图像、音频、视频、点云和时间序列数据等多模态数据集,并对具身智能、自动驾驶和世界模型开发提出了具体要求。该计划还将数据标注定位为战略性能力,在此前已确定的七个标注创新试点城市基础上,规划增设更多测试区。
这项政策标志着中国AI数据经济的转折点。通过建立基于代币的价值体系——国家数据局于2026年3月正式将代币归类为"词元",将其从技术概念提升为国家战略资产——该框架构建了数据定价、交易和结算的基础设施。政府正引导金融机构、耐心资本和产业基金加大对数据集建设的投入,同时鼓励政府机构和国有企业将数据采购纳入预算规划。
数据标注与代币经济成为核心焦点
该计划的一个核心支柱是将数据标注从劳动密集型流程转变为AI增强型流程。该框架要求转向人机协作并结合专家参与,推广模型辅助预标注和自动化质量验证。它还提出建立专家认证机制,确保领域特定知识嵌入到用于指令微调和强化学习的训练数据中。
在价值获取方面,该计划明确支持将代币交易作为一种新型交易模式,旨在以代币为基本单位构建可量化、可定价的数据价值体系。这与行业内的并行发展相一致:6月8日,上海上市的PATEO(02889.HK)宣布与巡测科技和赛摩科技建立三方合作伙伴关系,共同构建TokenOS——面向车载AI场景的边缘端代币基础设施,以及物理AI世界模型,这是英伟达生态内首个全栈价值闭环联盟。
数据权利框架开启资产化路径
该计划推进了中国的数据三权分置制度——持有权、使用权和经营权——并要求制定更清晰的规则,明确如何使用受版权保护的内容进行模型训练。该计划鼓励开展数据资产登记、估值以及创新融资模式的试点项目,包括数据质押贷款、作价出资、资产支持证券、数据信托和数据保险。
该框架还要求建立一个国家数据集管理服务体系,采用物理分布、逻辑集中的架构,利用隐私保护计算和区块链确保可追溯性。计划制定统一的质量评价标准,建立"一次评价、全国互认"的认证机制,以减少重复测试。
本文仅供参考,不构成投资建议。