共 16 条
低质量数据下的知识获取方案研究
被引:2
作者:
李兴森
[1
]
石勇
[2
]
鹿盟
[1
]
申爱华
[1
]
机构:
[1] 中国科学院研究生院管理学院
[2] 中国科学院数据技术与知识经济研究中心
来源:
关键词:
数据质量;
数据挖掘;
知识管理;
可拓学;
数据挖掘咨询;
企业信息化;
D O I:
10.13253/j.cnki.ddjjgl.2007.03.020
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
数据挖掘已经成为重要的知识来源。随着信息化的深入,企业对数据挖掘有了较大的需求,但数据质量差往往会造成数据挖掘的结论可信度低,从而影响了数据挖掘的应用。本文以可拓学方法,通过系统分析产生脏数据的原因,提出了基于学科链方法的数据清洗方案。通过数据挖掘手段发现数据质量差距,追溯到软件设计、实施、维护等上游环节,提出从来源环节解决问题的系统方法,并提出通过数据挖掘应用咨询促使数据质量改进的措施,从而降低数据清洗的工作量,使数据质量不高的企业也可以实施数据挖掘项目,获取决策支持所需的知识。
引用
收藏
页码:78 / 83
页数:6
相关论文