交汇点讯 2月2日,为帮助我省制造业企业系统化开展数据治理工作,指导企业用好面向人工智能的数据治理技术和方法,由江苏省工业和信息化厅会同国家工业信息安全发展研究中心编制的《江苏省制造业领域面向人工智能的数据治理工作参考指引(2026年版)》,正式对外发布。
进一步提升人工智能技术在制造业领域的融合应用水平,首先要理清数据治理与人工智能是什么样的关系。人工智能应用的核心是依托高质量数据完成模型训练、推理与迭代,数据治理则是保障数据质量的核心抓手,人工智能应用的深化,反向推动数据治理工作从“被动合规”向“主动价值驱动”升级。
当前,制造业领域数据“孤岛”与“失真”、数据治理与标准化缺失、数据与应用场景脱节等痛点问题严重制约了高质量、场景化数据集的供给。
作为制造大省,江苏在推进制造业“智改数转网联”和与人工智能赋能新型工业化的过程中,也暴露出新的问题:当模型能力日趋接近、供应日益充足,制造企业在拥抱“人工智能+”时仍感步履维艰,制约“人工智能+制造”价值释放的,不再是“有没有一个好模型”,而是“有没有能喂给模型、与业务深度耦合的高质量数据”。
在此背景下,本指引基于江苏制造业数据治理现状,结合人工智能应用典型场景,提出构建面向AI的数据治理体系,引导企业开展数据资产的系统性治理与建设,提升将物理世界的复杂系统转化为数字世界可计算、可优化、可创新的高质量数据资产能力。
该指引与之前版本相比有何区别呢?
江苏省工信厅信息化发展处相关人士解读说,该指引结合此前参考指引2025年版本提炼的31个人工智能典型应用场景,面向不同水平的企业划分人工智能场景建设中数据治理的入门、基础、进阶三个等级,为全省大中小企业典型场景的人工智能应用提供可对标、可参考、可部署的数据治理适配方案,指引内容更为全面清晰。
在制造业领域人工智能应用中,数据采集、预处理、特征工程、数据标注、数据划分、数据增强六大环节成为面向人工智能场景数据治理的核心环节,对能否产出适配 AI 模型训练与应用的优质数据起到关键作用。
《指引》分门别类地给出了治理路径,制造业企业可结合自身技术基础、资源条件及实际业务痛点,针对性选取适配的环节落地数据治理技术,最大化挖掘数据价值,为人工智能技术在制造业的深度应用筑牢数据根基。
比如,在数据采集中,存在数据“采不到”“采不准”“采不全”,以及“格式乱”“分布散”“溯源难”等问题,而在数据预处理过程中,则会遇到数据“脏”“乱”“繁”等问题,为此,《指引》在每个环节均列出了数据采集核心技术应用清单和配套工具清单,企业可根据问题一一对照,有的放矢地进行解决。
新华日报·交汇点记者 付奇

新华报业网
Android版
iPhone版