下载app

扫码下载

扫码关注

新华报业网  > 首页 > 正文
争夺人工智能标准话语权!全国首个可信AI智能体测试床在南京宣布启动建设

交汇点讯 417日,记者从南京市工信局获悉,全国首个可信AI智能体测试床在“人工智能赋能新型工业化深度行”南京站活动中宣布启动建设,意味着中国在人工智能产业协同与标准话语权争夺中迈出关键一步。

近年来,智能体作为大模型的关键应用模态,能够将模型能力转化为解决实际问题能力,在跨场景协作、任务执行等方面展现出巨大潜力。

但是,智能体在实际应用落地过程中,也面临工作流程繁杂、协作逻辑不清晰、身份可信性存疑、应用可靠性参差等诸多挑战。

此次中国信通院联合联通数科、中国移动研究院、华为、百度、VIVO、中兴通讯等单位,在南京启动可信AI智能体测试床建设,旨在构建覆盖多智能体协同测试的标准化环境,对智能体的理解分析、规划决策、通信交互、任务执行等能力进行全面验证和优化,推动智能体技术从实验室走向产业规模化应用。

为此,中国信通院提出“可信AI智能体测试床”的三大核心能力架构,以期破解智能体落地难题,构建一体化测试体系——

在资源配置层,系统配置智能体测试床的基础资源,包括计算设施、数据资源、网络设施、操作系统、基础软件等;在环境构建层,主要构建智能体测试环境,包括运行脚本调试、数据可视分析等基础测试环境,以及模型接入、智能体部署等运营管理环境;在任务测试层,重点面向MCP协议验证测试、单智能体基准测试、多智能体协同测试等典型任务建设测试体系。

所谓智能体“测试床”,其核心任务是通过三类测试场景,推动智能体技术的标准化与产业协同。

其中,MCP协议测试验证智能体通信协议的一致性、服务性能和扩展性,解决跨平台互联互通问题;单智能体基准测试评估智能体在感知、规划、执行等维度的能力,例如动态环境感知、任务拆解、数据库操作等;多智能体协同测试模拟复杂任务场景如智慧城市、工业自动化,验证多智能体协作的可靠性与效率。

测试床的标准化成果将直接服务于金融、制造、交通等领域,帮助企业降低30%的测试成本,提升50%的协作效率。

此次联合建设,还将构建产业协同新范式,参与企业将共享测试数据与场景资源,形成“技术研发测试优化商业落地”的闭环。

例如华为贡献其边缘计算与通信协议技术,优化智能体在高并发场景下的稳定性百度基于其大模型能力,提供自然语言交互与复杂任务规划的支持;吉利汽车则开放智能驾驶仿真环境,推动车联网场景下的协同测试;测试床还将与蚂蚁数科等企业的可信智能体技术平台联动,确保智能体在知识工程、交豆安全等环节的可靠性,降低产业化应用的潜在风险。

中国信通院相关负责人表示,下一步将重点完善测试床的评估标准与工具链,并计划于2025年底发布首份《可信AI智能体测试指南》。

新华日报·交汇点记者 付奇

责编:王建朋
版权和免责声明

版权声明: 凡来源为"交汇点、新华日报及其子报"或电头为"新华报业网"的稿件,均为新华报业网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"新华报业网",并保留"新华报业网"的电头。

免责声明: 本站转载稿件仅代表作者个人观点,与新华报业网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。

专题
视频

扫码下载

交汇点新闻APP

Android版

iPhone版

分享到微信朋友圈
打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。
分享到QQ
手机QQ扫描二维码,点击右上角 ··· 按钮分享到QQ好友或QQ空间