基于复杂网络的文本关键词提取算法研究

被引:17
作者
刘通
机构
[1] 上海交通大学安泰经济与管理学院
关键词
复杂网络; 关键词提取; 网络社区;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
将复杂网络理论应用于文本挖掘技术,构造基于词汇共现性关系的词汇概念复杂网络,对文本词汇的重要性指标进行计算分析,挖掘文本中主题的关键词。在计算词汇重要性指标时,综合考虑目标词汇的频率以及其相邻节点的贡献度。通过实验对比,证实了该网络节点评价指标与基于加权度和加权集聚系数的综合指标相比具有优越性。此外,通过复杂网络社区合并的手段,发现了关键节点之间的网络拓扑关系,即核心网络。通过分析核心网络,可以获得关键词和文本主题的对应关系,为进一步的文本分析提供有效的理论基础。
引用
收藏
页码:365 / 369
页数:5
相关论文
empty
未找到相关数据