基于语义域语言模型的中文话题关联检测

被引:19
作者
洪宇
张宇
范基礼
刘挺
李生
机构
[1] 哈尔滨工业大学计算机科学与技术学院信息检索研究室
关键词
关联检测; 话题检测与跟踪; 语义域; 语言模型; 依存分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
关联检测是话题检测与跟踪领域的基础性研究,其任务是检测任意新闻报道对是否论述同一话题.通过分析报道内容的结构关系和语义的分布规律,提出基于语义域语言模型的关联性检测方法,并在此基础上检验融入依存分析的语义描述策略对该模型性能的影响.实验采用TDT4中文语料进行评测,结果显示语义域语言模型显著改进了现有检测系统的性能,其最小DET代价降低了约3个百分点.
引用
收藏
页码:2265 / 2275
页数:11
相关论文
共 2 条
[1]   话题识别与跟踪中的层次化话题识别技术研究 [J].
于满泉 ;
骆卫华 ;
许洪波 ;
白硕 .
计算机研究与发展, 2006, (03) :489-495
[2]   An empirical study of smoothing techniques for language modeling [J].
Chen, SF ;
Goodman, J .
COMPUTER SPEECH AND LANGUAGE, 1999, 13 (04) :359-394