自动关键词抽取研究综述

被引:109
作者
赵京胜 [1 ,2 ]
朱巧明 [1 ]
周国栋 [1 ]
张丽 [2 ]
机构
[1] 苏州大学计算机科学与技术学院
[2] 青岛理工大学通信与电子工程学院
关键词
抽取; 机器学习; 统计; 主题; 语言网络图;
D O I
10.13328/j.cnki.jos.005301
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自动关键词抽取是从文本或文本集合中自动抽取主题性或重要性的词或短语,是文本检索、文本摘要等许多文本挖掘任务的基础性和必要性的工作.探讨了关键词和自动关键词抽取的内涵,从语言学、认知科学、复杂性科学、心理学和社会科学等多个方面研究了自动关键词抽取的理论基础.从宏观、中观和微观角度,回顾和分析了自动关键词抽取的发展、技术和方法.针对目前广泛应用的自动关键词抽取方法,包括统计法、基于主题的方法、基于网络图的方法等,总结了其关键技术和研究进展.对自动关键词抽取的评价方式进行了分析,对自动关键词抽取面临的挑战和研究趋势进行了预测.
引用
收藏
页码:2431 / 2449
页数:19
相关论文
共 24 条
[1]   基于改进TextRank的关键词抽取算法 [J].
张莉婧 ;
李业丽 ;
曾庆涛 ;
雷嘉丽 ;
杨鹏 .
北京印刷学院学报, 2016, 24 (04) :51-55
[2]   挖掘专利知识实现关键词自动抽取 [J].
陈忆群 ;
周如旗 ;
朱蔚恒 ;
李梦婷 ;
印鉴 .
计算机研究与发展, 2016, (08) :1740-1752
[3]   基于图和LDA主题模型的关键词抽取算法 [J].
刘啸剑 ;
谢飞 ;
吴信东 .
情报学报, 2016, 35 (06) :664-672
[4]   空间关键词搜索研究综述 [J].
刘喜平 ;
万常选 ;
刘德喜 ;
廖国琼 .
软件学报, 2016, 27 (02) :329-347
[5]   微博语言的复杂网络特征研究 [J].
马宏炜 ;
陆蓓 ;
谌志群 ;
黄孝喜 ;
王荣波 .
计算机工程与应用, 2015, 51 (19) :119-124+193
[6]   基于复杂网络的文本关键词提取算法研究 [J].
刘通 .
计算机应用研究, 2016, 33 (02) :365-369
[7]   带权复杂图模型的专利关键词标引研究 [J].
李军锋 ;
吕学强 ;
周绍钧 .
现代图书情报技术 , 2015, (03) :26-32
[8]   关键词自动提取方法的研究与改进 [J].
黄磊 ;
伍雁鹏 ;
朱群峰 .
计算机科学, 2014, 41 (06) :204-207
[9]   词语位置加权TextRank的关键词抽取研究 [J].
夏天 .
现代图书情报技术, 2013, (09) :30-34
[10]   基于TFIDF和词语关联度的中文关键词提取方法 [J].
张建娥 .
情报科学, 2012, 30 (10) :1542-1544+1555