一种基于复杂网络特征的中文文档关键词抽取算法

被引:42
作者
赵鹏
蔡庆生
王清毅
耿焕同
机构
[1] 中国科学技术大学计算机科学与技术系
基金
安徽省自然科学基金;
关键词
复杂网络; 语言网络; 关键词抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
关键词抽取是自然语言理解领域中的重要技术之一.本文研究汉语语言所组成的自然语言网络中的复杂网络特性,并根据语言网络中的"小世界"特性和近两年复杂网络研究中部分新的理论成果,提出基于复杂网络特征的中文文档关键词抽取算法.该算法根据文档语言网络中单词结点的复杂网络特征值进行关键词抽取.实验结果表明,本文算法抽取关键词所获得的平均准确率要高于 TFIDF 关键词抽取算法所获得的平均准确率.
引用
收藏
页码:827 / 831
页数:5
相关论文
共 1 条
  • [1] 汉字网络的3度分隔与小世界效应
    韦洛霞
    李勇
    李伟
    邵明珠
    罗诗裕
    [J]. 科学通报, 2004, (24) : 2615 - 2616