基于审计知识库的文本关联分析研究

被引:0
作者
周振煜
机构
[1] 哈尔滨工程大学
关键词
关联规则; 文本关联; 审计知识库; 关联规则应用;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
随着政府部门政务信息化程度的进一步提升,大量的信息开始以电子数据的形式存储起来,并被信息系统统一管理。但大量的文本信息仍以文档的形式被使用,文档中大部分的信息未能被深入使用。 本文以国家社会保险审计工作的实际需要为出发点,深入研究社会保险领域文本信息知识发现的途径。本文首先研究了国内外数据挖掘领域关联规则挖掘的研究成果,总结了文本关联分析方法的一般过程。其次,针对文本数据的非结构化的特点,分析在处理文本数据中存在的困难和问题,并就文本预处理工作中的方法进行了讨论。再次,在文本预处理的基础之上,讨论文本特征化表示结构上的关联分析的方法,以及结合审计知识库的语义关系特点,提出基于审计知识库的文本关联分析方法。最后分析了文本关联规则在审计领域中的应用。 基于社会基本养老保险的相关文本数据,对本文中提出的文本关联分析策略的实际效果进行验证,基于审计知识库的文本关联分析系统具备了领域内的适用性。
引用
收藏
页数:62
共 31 条
[1]
中文文本信息处理的原理与应用.[M].苗夺谦; 卫志华; 编著.清华大学出版社.2007,
[2]
基于SSVM的递归统计不相关特征抽取算法 [J].
任世锦 ;
王小林 ;
吕俊怀 ;
张晓光 .
计算机学报, 2011, 34 (03) :3443-3451
[3]
串匹配算法中模式串与文本之间关系的研究 [J].
刘萍 ;
刘燕兵 ;
郭莉 ;
方滨兴 .
软件学报, 2010, 21 (07) :1503-1514
[4]
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 [J].
黄名选 ;
严小卫 ;
张师超 .
软件学报, 2009, 20 (07) :1854-1865
[5]
关联规则挖掘技术的研究与应用 [J].
王晓宇 ;
秦锋 ;
程泽凯 ;
邹洪侠 .
计算机技术与发展, 2009, 19 (05) :220-223
[6]
构建社会保险计算机审计方法体系的思考与实践 [J].
社会保险计算机审计方法体系开发课题组 ;
吕天阳 ;
黄少滨 ;
蔡伟民 .
中国审计, 2009, (01) :48-50
[7]
一种改进的基于《知网》的词语语义相似度计算 [J].
江敏 ;
肖诗斌 ;
王弘蔚 ;
施水才 .
中文信息学报, 2008, (05) :84-89
[8]
语义查询扩展中词语-概念相关度的计算 [J].
田萱 ;
杜小勇 ;
李海华 .
软件学报, 2008, (08) :2043-2053
[9]
挖掘多关系关联规则 [J].
何军 ;
刘红岩 ;
杜小勇 .
软件学报, 2007, (11) :2752-2765
[10]
一种挖掘数值属性的二维优化关联规则方法(英文) [J].
贺志 ;
田盛丰 ;
黄厚宽 .
软件学报, 2007, (10) :2528-2537