基于引文的中文学术文献自动标引方法研究

被引:9
作者
王星
刘伟
机构
[1] 中国科学技术信息研究所
关键词
自动标引; 引用文献关系; 学术文献; 遗传算法;
D O I
10.13266/j.issn.0252-3116.2014.03.017
中图分类号
TP391.3 [检索机];
学科分类号
摘要
针对中文学术文献,提出一种新的自动标引方法,该方法基于文献之间的引用关系,利用被引文献的标引词,对遗传算法进行改进,实现自动标引,避免利用文献正文、标题等内部文本特征进行自动标引的局限性。通过在大规模真实测试集(中文学术文献)上进行实验,验证该方法的有效性。
引用
收藏
页码:106 / 110+105 +105
页数:6
相关论文
共 14 条
[1]   面向中文图书的自动标引模型构建及实验分析 [J].
王昊 ;
邹杰利 ;
邓三鸿 .
现代图书情报技术 , 2013, (Z1) :55-62
[2]   自动标引技术的回顾与展望 [J].
张静 .
现代情报, 2009, 29 (04) :221-225
[3]   基于条件随机场的自动标引模型研究 [J].
章成志 ;
苏新宁 .
中国图书馆学报, 2008, (05) :89-94+99
[4]   一种从医学文本中实现自动关键词抽取和筛选的技术方法 [J].
殷蜀梅 ;
张智雄 ;
吴振新 .
现代图书情报技术, 2008, (08) :31-36
[5]   中文分词十年回顾 [J].
黄昌宁 ;
赵海 .
中文信息学报, 2007, (03) :8-19
[6]   一种基于词汇链的关键词抽取方法 [J].
索红光 ;
刘玉树 ;
曹淑英 .
中文信息学报, 2006, (06) :25-30
[7]   关键词自动标引的最大熵模型应用研究 [J].
李素建 ;
王厚峰 ;
俞士汶 ;
辛乘胜 .
计算机学报, 2004, (09) :1192-1197
[8]   遗传算法编码机制的比较研究 [J].
张晋 ;
李冬黎 ;
李平 .
中国矿业大学学报, 2002, (06) :93-96
[9]  
中文文本关键词自动抽取方法研究[J]. 张雪英,Jürgen Krause.情报学报. 2008 (04)
[10]  
基于集成学习的自动标引方法研究[J]. 章成志.情报学报. 2010 (01)