在线新闻主题检测系统的设计与应用

被引:7
作者
万小军
杨建武
机构
[1] 北京大学计算机科学技术研究所
[2] 北京大学计算机科学技术研究所 北京 100871
关键词
主题检测; 增量式聚类算法; 加窗策略; 自适应倒排文档频率;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
利用主题检测技术可以从海量新闻信息中实时检测到主题信息,从而将新闻信息按照主题组织并加以利用.文中通过改进加窗策略,采用自适应倒排文档频率,设计了一个中文新闻主题检测系统并进行了实验.结果表明了该系统的有效性.该系统在新华网数据中心的成功应用进一步表明系统达到了实用需求.
引用
收藏
页码:42 / 46
页数:5
相关论文
共 2 条
[1]  
On-line new event detection and tracking .2 Allan J,Papka R,Lavrenko V. In the Proceedings of ACM SI GIR 1998 . 1998
[2]  
Umass at TDT 2000 .2 Allan J,Lavrenko V,Frey D,et al. In Proceedings of Topic Detection and Tracking Workshop . 2000