自然资源资产大数据审计关键技术研究
来源:知网 发布日期:2024-12-25
【摘要】:
领导干部自然资源资产离任(任中)审计是我国为贯彻落实生态文明制度建设提出的一项全新政府工作,具有综合性强、专业性强和技术应用密集的特点。在数字政府和数字经济的时代背景下,自然资源及管理相关的数据量积累,数据价值挖掘和知识服务提升将直接影响到自然资源资产审计水平,关系到国家治理现代化能力提升。当前,自然资源资产大数据审计还处于起步阶段,如何有效利用自然资源资产大数据,构建跨领域共享的自然资源资产数据模型,建立一套时空数据多维度关联分析及计算的技术方法,是挖掘自然资源资产大数据价值和实现自然资源资产高效审计的急迫现实需求。阻碍自然资源资产审计数据价值实现的问题主要在于行业数据标准不统一、数据与业务语义关系多样性、多源异构数据缺乏有效连接等。传统审计业务主要借助于人工经验和结构化数据查询,这种审计模式建立在专家经验和关系数据库基础上,缺少面向审计任务需求的自然资源资产管理全要素分析手段,对地理信息及技术应用不足。在此背景下,本文研究了自然资源资产审计数据体系和语义关系,提出一种基于地理本体的多层次语义关联模型。研究了基于多层次语义关联模型的自然资源资产审计知识图谱构建方法,提出了基于领域大数据的审计知识获取方法。基于审计知识图谱,提出语义相似度计算和地址解析的审计疑点搜索方法。最后,建立实验系统来验证理论方法的有效性,进行自然资源资产审计需求的多维度数据组织,实现了基于开放域审计疑点全景式发现和诊断。具体地,研究内容如下:(1)自然资源资产多层面语义关联调查自然资源资产审计概念内涵与数据需求,厘清审计过程、审计事项和部门业务活动、数据的逻辑关系,分析自然资源资产审计要素的过程语义、内容语义、事件流语义、时空语义和需求语义,研究面向审计需求的自然资源地理本体内容构成,构建“应用域、任务域、处理域、空间域和数据域”五域关联的表达模型,描述审计过程、审计事项、活动事件、地理要素和数据五类要素之间的多层面关联,提出基于地理本体的多层次语义关联数据模型,形成自然资源资产审计多要素语义表达,实现知识获得所需要的数据关联到语义关联。(2)多领域多层次自然资源资产审计知识构建和抽取方法在多层次语义关联模型的基础上,针对审计应用场景需求和自然资源资产数据特点,设计面向自然资源资产审计知识图谱,知识化表达审计多层次语义关系。面向多源异构数据,研究了对审计语义关系、政务业务语义关系、数据语义关系跨领域知识抽取方法,通过工作流元模型、基于规则模板和语义分析、自然语言处理技术综合运用,实现了自然资源资产审计实体、关系、属性知识抽取。(3)审计疑点的智能搜索方法调查自然资源资产审计疑点筛查识别需求,从业务、资源和时空三个角度,设计审计疑点特征向量,提出了一种基于知识图谱的疑点向量语义搜索模型,研究了顾及语义距离、信息量、属性的审计疑点语义相似度度量方法。研究了耦合标准地址解算和语义相似度模型的审计疑点智能搜索方法,利用互联网爬取数据实现了疑点智能搜索定位,提高了审计疑点分析链路对位置语义理解能力。(4)自然资源资产大数据审计综合解决方案及原型系统响应自然资源资产审计全覆盖的需求,基于审计业务链和大数据价值链的双链交互,研究了自然资源资产大数据审计技术体系。从数据采集、数据预处理、数据存储、数据关联分析、数据可视化的角度,设计了自然资源资产大数据审计综合解决方案及原型系统,实现对审计对象、审计计划、审计实施、大数据分析研判、疑点核查、在线监督指挥、审计预警、审计成果管理的业务链全域闭环管理。以某部门具体审计项目为例,验证了大数据审计关键技术的有效性和实用性。通过平台建设,实验成果已应用于武汉市自然资源资产大数据审计工作,具有显著的研究价值和实用价值。在理论层面,建立了基于地理本体的审计全要素多层次语义模型和自然资源资产大数据审计总体框架模型。在方法层面,设计了自然资源资产大数据审计知识图谱表示和知识抽取方法、基于知识图谱的审计疑点智能搜索方法。在实践层面,研发了自然资源资产大数据审计综合解决方案及原型系统,说明了理论方法和关键技术的可行性和有效性。论文研究为领导干部自然资源资产离任(任中)审计提供了新理论新技术支撑,为时空数据分析挖掘及共享提供了审计应用创新和技术集成创新。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2022