知网的话题更新与跟踪算法研究

被引:9
作者
焦健
瞿有利
机构
[1] 北京交通大学计算机与信息技术学院
关键词
自然语言处理; 话题跟踪; 新闻报道; 知网; 话题更新;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新的话题跟踪算法,提出了基于知网的近义动词分析的跟踪算法及基于知网的近义动词分析和话题更新的话题跟踪算法.实验表明话题更新和同义词近义词的消除提高了话题跟踪算法的性能.
引用
收藏
页码:132 / 136
页数:5
相关论文
共 5 条
[1]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[2]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 .
计算机工程与应用, 2003, (17) :7-10+109
[3]  
基于HowNet的话题跟踪及倾向性分类研究[J]. 金珠,林鸿飞,赵晶.情报学报. 2005 (05)
[4]   Simple Semantics in Topic Detection and Tracking [J].
Juha Makkonen ;
Helena Ahonen-Myka ;
Marko Salmenkivi .
Information Retrieval, 2004, 7 :347-368
[5]  
BoosTexter: A Boosting-based System for Text Categorization[J] . Robert E. Schapire,Yoram Singer.Machine Learning . 2000 (2-3)