基于子话题分治匹配的新事件检测

被引:28
作者
洪宇
张宇
范基礼
刘挺
李生
机构
[1] 哈尔滨工业大学计算机科学与技术学院信息检索研究室
关键词
新事件检测; 话题检测与跟踪; 子话题;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
新事件检测是话题检测与跟踪领域的一项重要研究,其任务是实时监控新闻报道流并从中识别新话题.现有方法将话题和报道描述为单一结构的特征向量进行匹配,造成子话题间互为噪声并形成错误语义,从而误导新话题的识别.针对这一缺陷,文中提出基于子话题分治匹配的新事件检测方法,将话题和报道划分为不同子话题,根据相关子话题的比例关系和分布关系建立新话题识别模型.实验在TDT4和TDT5中获得显著改进,最小检测错误代价为0.4061,相应漏检率为0.1859.
引用
收藏
页码:687 / 695
页数:9
相关论文
共 1 条
[1]   Simple Semantics in Topic Detection and Tracking [J].
Juha Makkonen ;
Helena Ahonen-Myka ;
Marko Salmenkivi .
Information Retrieval, 2004, 7 :347-368