“智能采数覆盖十三省,模型分析明晰转型路”,这个暑假,南京审计大学“语模助审转型实践团队” 围绕审计数字化前沿课题,开展了一场扎实的暑期社会实践。

团队以技术为核心,聚焦审计数字化转型需求。团队成员用 Python 技术搭配 Scrapy 框架,搭建了定向数据采集系统,抓取了北京、天津、江苏等省(市)相关部门官网、政府信息公开平台的相关信息。团队累计获取 2017-2025 年人工智能与大数据审计领域原始资料3200余条。在后续工作中,团队通过Python Pandas工具对数据进行“大扫除”——剔除重复数据 186 条、补全缺失信息234处,成功构建起6个标准化数据集。在此基础上,团队借助 DeepSeek大语言模型进行文本挖掘,结合分词、关键词提取等技术,梳理出“技术应用不断深化、区域发展存在差异、数据驱动作用凸显”三个审计数字化转型的实践特征,同时划分出三个发展阶段,提炼出6类关键影响因素。
此次实践成果兼具理论与现实价值。多省份审计数据集为全国性研究提供了有力支撑,调研报告也为审计机关优化技术应用提供专业参考并受到相关领域关注。团队成员在实践中实现了审计专业与信息技术的深度融合,综合能力显著提升。此外,团队还走进地方审计机关开展实地调研,进一步补充实践素材,用青春力量为审计数字化转型高质量发展助力。