话题检测与跟踪的评测及研究综述

被引:144
作者
洪宇
张宇
刘挺
李生
机构
[1] 哈尔滨工业大学计算机科学与技术学院信息检索研究室
关键词
计算机应用; 中文信息处理; 综述; 话题检测与跟踪; 自然语言处理; 事件; 新闻报道;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TDT领域的研究现状展望未来的发展趋势。
引用
收藏
页码:71 / 87
页数:17
相关论文
共 16 条
  • [11] Semantic Language Models for Topic Detection and Tracking .2 R Nallapati. Proceedings of HL T-NAACL 2003 Student Research Workshop . 2003
  • [12] Coherence and Cohesive Harmony .2 Hasan R. Understanding Reading Compre- hension . 1984
  • [13] A study on Retrospective and On-Line Event detection .2 Y Yang,T Pierce,J Carbonell. Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval . 1998
  • [14] Asystemfor new event detection .2 T Brants,F Chen,and A Farahat. Proceedings of the26th SI-GIR conference on Research and development in in-formation retrieval . 2003
  • [15] A trainable document summarizer .2 J Kupiec,J Pedersen. Proceedings of the 18th Annual Int‘l ACM SIGIR Conf on Research and Development in Information Retrieval (SIGIR‘95) . 1995
  • [16] http://www.ldc.upenn.edu .