共 2 条
面向互联网新闻的在线话题检测算法
被引:8
作者:
程葳
龙志祎
机构:
[1] 北京城市学院人工智能研究所
来源:
关键词:
在线话题检测;
话题检测与跟踪;
文本聚类;
D O I:
暂无
中图分类号:
TP391.4 [模式识别与装置];
学科分类号:
0811 ;
081101 ;
081104 ;
1405 ;
摘要:
针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法。该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略。应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试。结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14。
引用
收藏
页码:28 / 30
页数:3
相关论文