基于TValue融合领域度的术语抽取法

被引:4
作者
杨雅娜 [1 ]
刘胜奇 [2 ]
机构
[1] 中国邮政储蓄银行
[2] 中国专利信息中心
关键词
术语抽取; 术语识别; 数据挖掘; 领域度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出ATValue(Advanced TValue and Fieldhood Integration)术语抽取法。为提高术语抽取质量,在TValue五属性的基础上,提出领域度。通过相关性分析获得六属性组合值AValue,最后识别AValue高于术语可信度的词串来选择候选术语。能源行业的实验结果表明:ATValue术语抽取法的F值约比TValue术语抽取法高出2个百分点,原因在于ATValue的领域度测算了词串中各种单词对领域的贡献。
引用
收藏
页码:25 / 31
页数:7
相关论文
共 13 条
[1]  
Automatic term recognition based on statistics of compound nouns and their components. Nakagawa H,Mori T. Terminology . 2003
[2]  
Automatic recognition of multi-word terms:. the C-value/NC-value method[J] . Katerina Frantzi,Sophia Ananiadou,Hideki Mima. &nbspInternational Journal on Digital Libraries . 2000 (2)
[3]  
Development of a GTM-based patent map for identifying patent vacuums[J] . Changho Son,Yongyoon Suh,Jeonghwan Jeon,Yongtae Park. &nbspExpert Systems With Applications . 2011 (3)
[4]   TValue术语抽取法 [J].
刘胜奇 ;
朱东华 .
情报学报, 2013, 32 (11) :1164-1173
[5]   基于专利分析的替代性技术识别研究 [J].
娄岩 ;
张赏 ;
黄鲁成 ;
苗红 .
情报杂志, 2014, (09) :27-32
[6]  
http://gensen.dl.itc.u-tokyo.ac.jp/gensenwebeng.html .
[7]  
http://ictclas.org .
[8]  
http://nlp.stanford.edu/software/tagger.shtml .
[9]   基于条件随机场的汽车领域术语抽取 [J].
李丽双 ;
党延忠 ;
张婧 ;
李丹 .
大连理工大学学报, 2013, 53 (02) :267-272
[10]  
Improvement of Terminology Extraction Method for Specific Patent Search[J] . Kyoko Yanagihori,Koji Tanaka,Kazuhiko Tsuda. &nbspProcedia Computer Science . 2014