新华日报财经讯 7月31日,D20数据要素沙龙在江苏国际数据港邀约近百位专业人士齐聚,政企研三方联手发起“高质量数据集认证革命”。
当算法与算力竞争步入平台期,数据质量正成为人工智能时代的“胜负手”,高质量数据集的战略价值愈发凸显。数据显示,2024年全国数据产量达41ZB(泽字节),同比增长25%。其中公共数据体量最大、价值最高,但“不敢共享、不会应用”仍是价值释放的枷锁。
南京市数据局数字经济处副处长孙汉卿直言,目前数据要素市场探索中,存在数据产品化路径不通畅、数据集质量标准不统一、跨领域流通面对标准缺失受阻等问题,需政企研协同解决。“南京作为长三角数据枢纽,已从制度设计走向实践深耕。”孙汉卿说。
南京市玄武区数据局相关负责人介绍,该区依托江苏国际数据港枢纽地位,联合中国质量认证中心建立数据集测评机制,目前已为卫星影像样本库等提供标准护航。
中国质量认证中心上线了“CQC-6D模型”,从数据规模、模态等六大维度构建评价体系,填补全流程质量审核空白。该中心区块链与数据服务部部长王锋介绍,目前,这一探索已在全国多处落地。
“AI竞赛决胜于数据质量,而我们面临‘不快、不高、不强’的共性挑战。”安徽飞数科技李华均介绍,公司推出“工具链+专业化管理”的创新解法,通过自研采集处理技术承担40%基础工作,赋能普通标注员以“60分能力完成90分任务”。
数族科技凭借“企业经营指标特性数据集”斩获全国首张人工智能高质量数据集评价证书。该公司首席数据官杨平表示,区域产业存在“政策算不准、链条看不清、需求摸不透”三大断层。为此,数族科技以票据数据为切口,从高质量数据集建设出发,自主研发产业智算器,实现“数据获取—加工建模—应用价值转化输出”全链路流程。目前已经在金融信贷、政策制定场景释放价值。
江苏国际数据港基础设施部经理刘锦武以电池护照为例,解读行业首部数据标准及《中国电池数字护照体系白皮书》,该体系实现全生命周期数据“一码通全球”,为中国电池出海批量办理、管理“身份证”,构建回收溯源等高质量数据集。据悉,广东一家电池企业未拿到数字护照时,每柜货物因缺少数字护照被扣留7天,滞港费高达15万,通过产品数字护照,通关时间缩短到2小时,运费节省30%,通过构建“数据+服务+资源”三位一体的集成体系,帮助企业综合成本下降15%-20%。
江苏省地质调查研究院卫星中心遥感应用开发室主任李胤现场解析卫星影像解译样本库,展示全流程质控闭环,通过智能分标、动态质检等闭环,极大提升了样本数据的可靠性和准确性。
中国移动紫金研究院区块链技术总监周晓阳则提出中国移动的“数联网(DSSN)”与“可信数据空间”技术路线,服务于国家数据基础设施建设试点工程,打造全国互联互通的数据网络,已赋能江苏建设“1+13’省市公共数据授权运营一体链。
新华日报·财经记者 何玥颐