命名实体的网络话题K-means动态检测方法

被引:4
作者
刘素芹 [1 ]
柴松 [1 ,2 ]
机构
[1] 中国石油大学计算机与通信工程学院
[2] 山东省军区自动化工作站
关键词
命名实体; 网络话题; 动态检测; K-means聚类; 自相似度; 话题向量;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
针对传统的网络话题检测方法在文本特征表示方面的不足及K-means聚类算法面临的问题,提出了一种基于命名实体的网络话题K-means动态检测方法.该方法对传统话题检测的特征表示方法进行了改进,用命名实体和文本特征词相结合表示文本特征,用命名实体对文本表示的贡献大小表示命名实体的权重;另外,利用自适应技术对K-means聚类算法中的K值进行自收敛,对K-means聚类算法进行了优化,利用K值的动态选取来实现网络话题的动态检测.实验结果表明,该方法较好地区分了相似话题,有效提高了话题检测的性能.
引用
收藏
页码:122 / 126
页数:5
相关论文
共 2 条
  • [1] 话题检测与跟踪的评测及研究综述
    洪宇
    张宇
    刘挺
    李生
    [J]. 中文信息学报, 2007, (06) : 71 - 87
  • [2] 基于多策略优化的分治多层聚类算法的话题发现研究
    骆卫华
    于满泉
    许洪波
    王斌
    程学旗
    [J]. 中文信息学报, 2006, (01) : 29 - 36