共 3 条
基于实体识别的在线主题检测方法
被引:4
作者:
付艳
杨冬青
唐世渭
伍伟
王腾蛟
高军
机构:
[1] 高可信软件技术教育部重点实验室,北京大学信息科学技术学院
关键词:
在线主题检测;
命名实体;
实体识别;
增量聚类;
后缀树聚类;
D O I:
10.13209/j.0479-8023.2009.035
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。
引用
收藏
页码:227 / 232
页数:6
相关论文