特征驱动的关键词提取算法综述

被引:45
作者
常耀成 [1 ]
张宇翔 [1 ]
王红 [1 ]
万怀宇 [2 ]
肖春景 [1 ]
机构
[1] 中国民航大学计算机科学与技术学院
[2] 不详
关键词
关键词提取; 候选关键词生成; 特征; 有监督方法; 图方法;
D O I
10.13328/j.cnki.jos.005538
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取3个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法.
引用
收藏
页码:2046 / 2070
页数:25
相关论文
共 19 条
  • [1] 自动关键词抽取研究综述
    赵京胜
    朱巧明
    周国栋
    张丽
    [J]. 软件学报, 2017, 28 (09) : 2431 - 2449
  • [2] 挖掘专利知识实现关键词自动抽取
    陈忆群
    周如旗
    朱蔚恒
    李梦婷
    印鉴
    [J]. 计算机研究与发展, 2016, (08) : 1740 - 1752
  • [3] 一种基于词汇链的关键词抽取方法
    索红光
    刘玉树
    曹淑英
    [J]. 中文信息学报, 2006, (06) : 25 - 30
  • [4] 中文社交媒体话题关键词抽取算法[D]. 何伟名.北京交通大学. 2017
  • [5] RankUp: Enhancing graph-based keyphrase extraction methods with error-feedback propagation[J] . Gerardo Figueroa,Po-Chi Chen,Yi-Shin Chen.Computer Speech & Language . 2018
  • [6] TSAKE: A topical and structural automatic keyphrase extractor[J] . Javad Rafiei-Asl,Ahmad Nickabadi.Applied Soft Computing . 2017
  • [7] A Graph-based Approach of Automatic Keyphrase Extraction[J] . Yan Ying,Tan Qingping,Xie Qinzheng,Zeng Ping,Li Panpan.Procedia Computer Science . 2017
  • [8] Efficient sequential pattern mining with wildcards for keyphrase extraction[J] . Fei Xie,Xindong Wu,Xingquan Zhu.Knowledge-Based Systems . 2017
  • [9] Using lexical chains for keyword extraction
    Ercan, Gonenc
    Cicekli, Ilyas
    [J]. INFORMATION PROCESSING & MANAGEMENT, 2007, 43 (06) : 1705 - 1714
  • [10] Accessor variety criteria for Chinese word extraction
    Feng, HD
    Chen, K
    Deng, XT
    Zheng, WM
    [J]. COMPUTATIONAL LINGUISTICS, 2004, 30 (01) : 75 - 93