基于文本挖掘的话题发现技术

被引:5
作者
高妮 [1 ]
周明全 [2 ]
耿国华 [1 ]
王学松 [2 ]
贺毅岳 [1 ]
机构
[1] 西北大学信息学院计算机科学系
[2] 北京师范大学信息科学与技术学院
关键词
话题发现与跟踪; 层次聚类; 文本挖掘; 动态阈值;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在分析灾害新闻特点的基础上,提出一种基于文本挖掘的话题发现技术,采用基于平均分组的层次聚类算法,对灾害新闻资料进行组织,从而生成新闻专题,为用户提供个性化服务,并形成专题检测系统,同时介绍基于时间和地点权值向量的相似度计算模型以及基于时间的动态阈值模型。实验结果表明,该算法能够获得较好的性能。
引用
收藏
页码:36 / 38
页数:3
相关论文
共 3 条