基于动态阈值和命名实体的双重过滤话题追踪

被引:6
作者
魏景璇 [1 ,2 ]
鲁燃 [1 ,2 ]
张艳辉 [1 ,2 ]
机构
[1] 山东师范大学信息科学与工程学院
[2] 山东省分布式计算机软件新技术重点实验室
关键词
动态阈值; 命名实体; 双重过滤; KL距离; 话题追踪;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法。该方法中,研究了KL距离计算初始阈值,并筛选出候选报道;然后,根据报道时间特点研究了动态阈值方法;最后,抽取追踪话题和测试报道中命名实体,计算命名实体间的相似度以及命名实体相同的个数来选出相关报道,完成话题追踪。通过实验证明该方法的可行性,实验结果表明基于动态阈值和命名实体双重过滤方法能有效地改善话题追踪的性能,并有效降低了话题追踪的误报率和漏报率。
引用
收藏
页码:982 / 985
页数:4
相关论文
共 1 条
[1]  
Asubtopicdivisioninnewsspecial.2LiJun,LiJuan-zi.Proceedingsofthe4thNationalInformationRetrievalandContentSafetyAcademicConferences.2008