共 2 条
命名实体的网络话题K-means动态检测方法
被引:4
作者:
刘素芹
[1
]
柴松
[1
,2
]
机构:
[1] 中国石油大学计算机与通信工程学院
[2] 山东省军区自动化工作站
来源:
关键词:
命名实体;
网络话题;
动态检测;
K-means聚类;
自相似度;
话题向量;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
针对传统的网络话题检测方法在文本特征表示方面的不足及K-means聚类算法面临的问题,提出了一种基于命名实体的网络话题K-means动态检测方法.该方法对传统话题检测的特征表示方法进行了改进,用命名实体和文本特征词相结合表示文本特征,用命名实体对文本表示的贡献大小表示命名实体的权重;另外,利用自适应技术对K-means聚类算法中的K值进行自收敛,对K-means聚类算法进行了优化,利用K值的动态选取来实现网络话题的动态检测.实验结果表明,该方法较好地区分了相似话题,有效提高了话题检测的性能.
引用
收藏
页码:122 / 126
页数:5
相关论文