基于实体识别的在线主题检测方法

被引:4
作者
付艳
杨冬青
唐世渭
伍伟
王腾蛟
高军
机构
[1] 高可信软件技术教育部重点实验室,北京大学信息科学技术学院
关键词
在线主题检测; 命名实体; 实体识别; 增量聚类; 后缀树聚类;
D O I
10.13209/j.0479-8023.2009.035
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为提高在线主题的检测效率,作者提出了一种基于实体识别技术的在线主题检测方法,利用新闻报道中的命名实体快速判断新到达报道与历史主题的关系,从而减少对报道间文本相似度的计算。实验结果显示,本文提出的方法能够在不牺牲检测准确率的基础上,显著提高在线主题检测的效率。
引用
收藏
页码:227 / 232
页数:6
相关论文
共 3 条
[1]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[2]   在线新闻主题检测系统的设计与应用 [J].
万小军 ;
杨建武 .
华南理工大学学报(自然科学版), 2004, (S1) :42-46
[3]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 .
计算机工程与应用, 2003, (17) :7-10+109