基于共词分析的文本主题词聚类与主题发现

被引:31
作者
王小华
徐宁
谌志群
机构
[1] 不详
[2] 杭州电子科技大学计算机应用技术研究所
[3] 不详
基金
浙江省自然科学基金;
关键词
共词分析; TF-IDF; 共词矩阵; Bisecting; K-means; 主题;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。
引用
收藏
页码:1621 / 1624
页数:4
相关论文
共 7 条