基于语义角色标注的专利主题提取研究

被引:4
作者
孟令恩
李颖
何彦青
屈鹏
王惠临
机构
[1] 中国科学技术信息研究所
关键词
语义角色标注; 简化句; 主题抽取; 专利文献;
D O I
10.13266/j.issn.0252-3116.2014.19.003
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。
引用
收藏
页码:19 / 24
页数:6
相关论文
共 10 条
[1]   中文专利信息资源深加工方案设计与实证研究 [J].
张兆锋 ;
桂婕 ;
李颖 ;
杜永萍 .
数字图书馆论坛, 2014, (07) :45-51
[2]   多数据源协同下的专利分析系统构建 [J].
汪雪锋 ;
王有国 ;
刘玉琴 .
图书情报工作, 2013, 57 (14) :92-96
[3]   基于本体的专利摘要知识抽取 [J].
姜彩红 ;
乔晓东 ;
朱礼军 .
现代图书情报技术, 2009, (02) :23-28
[4]   A large-scale classification of English verbs [J].
Kipper, Karin ;
Korhonen, Anna ;
Ryant, Neville ;
Palmer, Martha .
LANGUAGE RESOURCES AND EVALUATION, 2008, 42 (01) :21-40
[5]  
The Proposition Bank: An Annotated Corpus of Semantic Roles[J] . Martha Palmer,Daniel Gildea,Paul Kingsbury. Computational Linguistics . 2005 (1)
[6]  
Support Vector Learning for Semantic Argument Classification[J] . Sameer Pradhan,Kadri Hacioglu,Valerie Krugler,Wayne Ward,James H. Martin,Daniel Jurafsky. Machine Learning . 2005 (1)
[7]   Automatic Labeling of semantic roles [J].
Gildea, D ;
Jurafskyy, D .
COMPUTATIONAL LINGUISTICS, 2002, 28 (03) :245-288
[8]  
Random Forests.[J] . Leo Breiman. Machine Learning . 2001 (1)
[9]  
Improved Boosting Algorithms Using Confidence-rated Predictions.[J] . Robert E. Schapire,Yoram Singer. Machine Learning . 1999 (3)
[10]  
Hierarchical Recognition of Propositional Arguments with Perceptrons .2 X. Carreras,L. Marquez,G. Chrupala. HLTNAACL 2004 Workshop: Eighth Conference on Computational Natural Language Learning (CoNLL-2004) . 2004