面向互联网新闻的在线话题检测算法

被引:8
作者
程葳
龙志祎
机构
[1] 北京城市学院人工智能研究所
关键词
在线话题检测; 话题检测与跟踪; 文本聚类;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法。该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略。应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试。结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14。
引用
收藏
页码:28 / 30
页数:3
相关论文
共 2 条
  • [1] 基于子话题分治匹配的新事件检测
    洪宇
    张宇
    范基礼
    刘挺
    李生
    [J]. 计算机学报, 2008, (04) : 687 - 695
  • [2] 话题检测与跟踪的评测及研究综述
    洪宇
    张宇
    刘挺
    李生
    [J]. 中文信息学报, 2007, (06) : 71 - 87