带权复杂图模型的专利关键词标引研究

被引:6
作者
李军锋
吕学强
周绍钧
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
基金
北京市自然科学基金;
关键词
复杂图模型; 拓扑势; 关键词标引; 平均连通权重; 综合相关特征;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
【目的】专利关键词标引是中文信息处理领域较为基础的环节,在专利检索、专利翻译以及专利自动摘要中具有较高的应用价值。【方法】采用K-最邻近耦合图将专利文献映射成复杂网络图模型,结合平均路径变化量、平均聚类系数变化量以及当前节点对整个复杂图模型流动性的影响,提出平均连通权重评价指标。分析关键词位置信息、关键词跨度信息以及关键词逆文档频率信息,提出专利综合相关特征衡量关键词的重要性。【结果】在传感器领域专利文献的实验结果中,Top-8级别上准确率达到60.9%,Top-10级别上召回率达到73.4%。【局限】对低频关键词的处理效果不够理想,影响了标引效果。【结论】实验结果表明该方法的有效性,对专利标引具有积极意义。
引用
收藏
页码:26 / 32
页数:7
相关论文
共 9 条
[1]   词语位置加权TextRank的关键词抽取研究 [J].
夏天 .
现代图书情报技术, 2013, (09) :30-34
[2]   基于图模型的关键词挖掘方法 [J].
翟周伟 ;
刘刚 ;
吕玉琴 .
软件, 2012, 33 (08) :9-13
[3]  
基于集成学习的自动标引方法研究[J]. 章成志. 中国索引. 2009(02)
[4]  
基于集成学习的自动标引方法研究[J]. 章成志. 中国索引. 2009 (02)
[5]   基于小世界模型的复合关键词提取方法研究 [J].
马力 ;
焦李成 ;
白琳 ;
周雅夫 ;
董洛兵 .
中文信息学报, 2009, 23 (03) :121-128
[6]   自动标引技术的回顾与展望 [J].
张静 .
现代情报, 2009, 29 (04) :221-225
[7]   基于分离模型的中文关键词提取算法研究 [J].
罗准辰 ;
王挺 .
中文信息学报, 2009, (01) :63-70
[8]   一种基于词汇链的关键词抽取方法 [J].
索红光 ;
刘玉树 ;
曹淑英 .
中文信息学报, 2006, (06) :25-30
[9]  
网络拓扑结构中节点重要性评价方法的研究[D]. 于少然.北京交通大学. 2012