在数字经济加速发展的当下,算力作为核心生产要素的作用日益凸显。随着人工智能技术的不断演进,大模型已逐步走入各类应用场景。近日,南京人工智能计算中心技术团队通过深入研究包括张量并行、模型量化在内的推理加速技术,依托华为MindIE昇腾推理引擎,利用W8A8量化技术,成功实现模型吞吐量的倍数提升,显著提升了大模型推理性能。

全栈国产化架构,打造安全高效算力底座
据了解,南京人工智能计算中心位于江北新区先进计算产业创新中心,配备140PFLOPS@FP16规模的国产算力集群,基于华为昇腾AI芯片构建全栈软硬件框架,从底层硬件的昇腾910训练芯片到中层CANN异构计算架构,再到上层MindSpore框架及自动化训练工具,实现技术自主可控。
在安全性方面,中心算力服务系统通过国家信息安全等级保护三级认证和商用密码应用安全性评估,并于2024年11月采用物理隔离专线与政务云对接的方式,接入南京市电子政务外网,为政务、金融等敏感领域提供合规算力支撑。
普惠算力服务降门槛,中小企业“轻装上阵”
为解决中小企业算力短缺难题,中心推出“共享+专属”灵活计费模式:共享资源池按卡时计费,适合短期项目;专属资源池支持长期高负荷运算,满足企业差异化需求。
在医疗健康领域,中心支撑江北新区生物医药公共平台打造AI+制药创新平台,相关成果在全国数据要素总决赛中获一等奖;在科技创新领域,与重点院校联合开发的遥感科学、智慧教育两项课题,已经成功获得“2024年省科技厅前沿技术研发计划项目立项”。
全流程技术赋能,破解企业“落地难”痛点
为帮助企业跨过技术门槛,中心组建本地技术团队提供“保姆式”技术服务,形成了从模型迁移适配到推理优化的成熟服务链条:中心联合南京市生态环境局开发生态环境大模型智能助手,基于国产算力构建环境法规知识库,实现政务咨询、执法辅助数字化。相关案例入选“2024年第七届数字中国典型应用案例”,成为国产算力赋能政务服务的标杆。
构建开放生态,激活产业创新动能
作为公共技术平台,中心持续发挥“连接器”作用,累计举办10余场产业峰会、创新大赛,推动顶山星河、智子引擎等近10家大模型企业在南京的创新发展。在人才培养方面,联合东南大学、南京航空航天大学开展“昇腾高校行”系列活动,全年培训师生超5000人,推动“产学研用”深度融合。
从技术自主可控到生态开放创新,南京人工智能计算中心正以国产化算力为支点,撬动千行百业智能化转型。随着算力基础设施的不断完善,这座“智能引擎”将在数字经济浪潮中释放更大能量,书写产业升级的新篇章。