话题识别与跟踪中的层次化话题识别技术研究

被引:48
作者
于满泉
骆卫华
许洪波
白硕
机构
[1] 中国科学院计算技术研究所软件研究室
关键词
话题识别与跟踪; 层次化话题识别; 多层聚类; 命名实体; 指代消解;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
话题识别与跟踪(topic detection and tracking,TDT)旨在发展一系列基于事件的信息组织技术,层次化话题识别(hierarchical topic detection,HTD)是其中一项全新的任务定义形式.通过连续的大规模评测,话题识别与跟踪已成为国际上自然语言处理尤其是信息检索领域的一个研究热点.为此,将自然语言处理与信息检索技术相结合,提出了针对事件特点的切实有效的单粒度话题识别方法,并提出了基于多层聚类的MLCS算法对话题进行层次化组织.所提出的方法具有很好的效果,在TDT2004的HTD评测中,该方法取得了第2名的成绩.
引用
收藏
页码:489 / 495
页数:7
相关论文
共 2 条
  • [1] Simple Semantics in Topic Detection and Tracking
    Juha Makkonen
    Helena Ahonen-Myka
    Marko Salmenkivi
    [J]. Information Retrieval, 2004, 7 : 347 - 368
  • [2] TDT2004official results .2 NIST. . 2004