下载app

扫码下载

扫码关注

新华报业网  > 财经/一周热点 > 正文
“数智未来”大赛之油气管输|标注250万道数据,为了看清一张焊缝底片

新华日报财经讯 3月26日,“数智未来”高质量数据集开发者创新大赛结果在报名网站公示。能源管输赛道中,中国石油大学(北京)“管线哨兵队”,和宁夏大学“从容应队”获得了“数据开发比赛”的两个一等奖。国家管网集团建设项目管理公司与中国石油天然气管道科学研究院联合团队斩获了“高质量数据集比赛”的一等奖。

他们的作品,都指向同一个核心命题:通过具身智能,让能源“大动脉”更安全、更高效。

数据攻坚瞄准250万道焊缝

决赛当日,国家管网集团建设项目管理公司团队正在答辩

“大口径高钢级长输管道焊缝底片评价”场景是能源管输领域最硬的骨头之一。国家管网集团建设项目管理公司针对该场景,尤其是需要在“大口径高钢级管道的环焊缝底片”上,智能识别出裂纹、未焊透、未熔合等缺陷。传统人工评片,效率低、受人为影响因素大,且容易出现错漏评。

“以250万道海量数据为基础,团队用一年多时间完成8万个典型缺陷标注。”该公司一级工程师郑洪峰说,11人团队分工明确,3人负责数据收集整理,4名持证检测专家负责标注复核,2名算法工程师开发优化AI模型,2人全程质控。每两周同步一次进度,遇到问题及时调整。

问题难点接踵而至,图像质量参差不齐,专家标注存在主观差异,模型优化耗时耗力。针对这些问题,他们把数据分等级处理,组织专项培训统一标注标准,采用“双人复核+AI复核”确保准确性,用2台专用服务器并行训练参数调优。

“效果远超预期。”郑洪峰说。基于该数据集训练的AI小模型,能对现场上传的图像进行质量判定,对人工评判结果自动比对,防止错漏评;还能用于图像的自动标注,大大加快数据库扩容。“这套成果已具备共享给行业同类企业的条件,有望推动整个射线检测领域的智能化发展。”他说。

培训AI掌握物理规律

“管线哨兵队”的5名成员,均来自中国石油大学(北京)油气储运工程专业,指导老师是该大学副教授史博会,队员包括2名博士生、2名硕士生。赛题聚焦“油气管道光纤振动智能监测”,即用光纤振动信号识别第三方施工、机械作业等入侵事件,同时抑制环境误报。

队长赵周丙说,最大挑战是样本极不均衡:干扰信号数量远超真实破坏信号,且瀑布图本身具有明确的物理含义,不能随意使用传统数据增强方法。不同类别的瀑布图整体相似,仅在细微处有差别,容易发生信号混淆。

依托课题组在深度学习方面的长期积累,他们快速设计出保留物理意义的数据增强方案和超类学习策略。

答辩过程中,有评委追问:“如何减少误报?如何区分不同类别瀑布图之间的细微差别?”这些正是现场工程中真实存在的痛点。“评委建议我们将细分类别标签与图像特征建立联系,这个方向让我们很受启发。”赵周丙说。

培训期间,来自中国石油大学(北京)的参赛团队成员正在进行讨论

赛后,他们更坚定了“物理机理感知+垂直行业大模型”这一工业智能感知的技术路径,其技术思想源自物理信息神经网络,即把现有的一些物理方程添加到神经网络训练过程中的损失函数中,引导模型在执行任务时遵循物理规律。

“纯数据驱动的AI像一个死记硬背的学生,换个场景就出错。一旦掌握了物理公式,到了新场景,AI模型也能运用公式推导,更安全更可靠。”赵周丙表示,这种算法能更好地服务于高质量数据集建设,更能直接赋能油气管网的安全监测。“未来,希望形成具有自主知识产权的核心工具,服务国家新型能源体系智能化建设。”

中国石油大学(北京)“数据开发比赛”参赛团队合影

“一张白纸”集训后拿下一等奖

与石油大学团队的专业背景形成鲜明对比,“从容应队”的4名成员,都是本科学生,来自宁夏大学软件工程、电子商务两个专业。“对能源管输领域,团队几乎是一张白纸。”队长于菊红说。

赛题要求对500张照片中的挖掘机、汽车、警示牌三类目标进行标注,再训练模型。他们面临三重压力:专业背景与能源管输关联度低;赛事时间短,数据标注、模型训练、系统开发任务集中,电脑算力不足;竞争对手包含石油大学专业学生、研究生及企业从业者。

他们边听课边梳理赛题,用大模型快速补足行业知识盲区,生成1万多字相关资料;团队分工协作,理性讨论并实践不同方案;基于YOLO模型,设计“自动标注+人工微调”的小系统,即先通过训练好的模型自动打标签,再人工核对修改,解决人工标注耗时问题。

夏毓欣回忆,团队用大模型调优约6次,在12小时内完成了从梳理思路到提交成果的全流程。赛后,这支队伍的规划悄然改变:有人坚定了考研深造的方向,有人对能源管输行业产生浓厚兴趣,有人希望成为“懂算法+懂行业”的复合型人才。

决赛现场,来自宁夏大学的“从容应队”正在回答评审专家提问。

三支获奖团队,三种不同的路径。但他们的共性,同样清晰:无论是焊缝底片、光纤振动,还是管道巡线,背后都是同一个命题:用高质量数据集,为能源“大动脉”装上智能感知的“神经末梢”。

围绕这一目标,高质量数据集的打造有了更清晰的路径:要让一张焊缝底片能被AI“看”出隐患;要让一根光纤能“听”到挖掘机的轰鸣;还能让一支本科生队伍在72小时内为产业难题交出答卷……这样一场为AI“造粮”的比赛,为中国能源管道的智能化转型,埋下一颗颗坚实的种子。

附:“数智未来”高质量数据集开发者创新大赛公示时间截至4月3日。

公示网址为:https://nsf-2025szwl.njbigdata.cn/web/resultAnnouncement

新华日报·财经记者 何玥颐 何钰 实习生 王耀辉 张洁

责编:陈娟
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间