实体识别问题的相关研究

被引:15
作者
刘显敏
李建中
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
数据质量; 实体识别; 脏数据;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
081102 [检测技术与自动化装置];
摘要
随着信息技术的发展,信息时代已经全面到来了。在信息"量"爆炸性增长的同时,近年来,"质"的问题也已经引起了产业界和研究人员的关注。"劣质"数据极大地降低了信息的可用性,提供给用户不精确的、缺失的、冗余的、陈旧的甚至是错误的信息,无法给用户带来正确的知识,并可能误导用户做出错误的决策,从而给用户造成损失。数据质量有六个主要维度:精确性、完整性、时效性、一致性、相关性和实体同一性。综述了数据质量中实体同一性方面的相关工作,并针对特定的技术展开讨论。
引用
收藏
页码:1 / 5+10 +10
页数:6
相关论文
共 2 条
[1]
Generic entity resolution with negative rules.[J].Steven Euijong Whang;Omar Benjelloun;Hector Garcia-Molina.The VLDB Journal.2009, 6
[2]
Entity identification in database integration..Li m E;Srivastava J;Prabhakar S;Richardson J;.Information Systems.1996,