基于综合权重的多文档关键词抽取算法

被引:1
作者
胡志敏
机构
[1] 湖南城建职业技术学院信息工程系
关键词
抽取算法ITF/PDF。将ITF/PDF的抽取结果与TF/PDF抽取结果进行了比较,实验结果表明,ITF/PDF能够更准确的在多文档中抽取合适的关键词。关键词多文档; 关键词; 抽取; 综合权重;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
多文档关键词抽取是进行在多篇文献中找出最能反映整体主题的关键词。对几种关键词抽取算法进行了介绍,分析了各自的优缺点,在TF/PDF算法的基础上,采用文献内和文献间综合权重的方法,提出了一种基于综合权重的多
引用
收藏
页码:45 / 48
页数:4
相关论文
共 6 条
[1]   TFIDF算法研究综述 [J].
施聪莺 ;
徐朝军 ;
杨晓江 .
计算机应用, 2009, 29(S1) (S1) :167-170+180
[2]   自动标引技术的回顾与展望 [J].
张静 .
现代情报, 2009, 29 (04) :221-225
[3]   以关键词抽取为核心的文摘句选择策略 [J].
马亮 ;
何婷婷 ;
李芳 ;
陈劲光 ;
邵伟 .
中文信息学报, 2008, 22 (06) :50-54
[4]   一种基于复杂网络特征的中文文档关键词抽取算法 [J].
赵鹏 ;
蔡庆生 ;
王清毅 ;
耿焕同 .
模式识别与人工智能, 2007, 20 (06) :827-831
[5]   基于粗集理论的中文关键词短语构成规则挖掘 [J].
刘远超 ;
王晓龙 ;
徐志明 ;
刘秉权 .
电子学报, 2007, (02) :371-374
[6]   一种基于词汇链的关键词抽取方法 [J].
索红光 ;
刘玉树 ;
曹淑英 .
中文信息学报, 2006, (06) :25-30