基于有效词频的改进C-value自动术语抽取方法

被引:11
作者
熊李艳
谭龙
钟茂生
机构
[1] 华东交通大学信息工程学院
关键词
自动术语抽取; EC-value; 有效词频; 术语簇;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
现有的中文术语自动抽取方法主要针对术语的高频特征与单元性指标,而低频术语和术语的术语性指标缺乏有效的处理方法。针对上述问题,将背景语料库引入C-value方法,提出词语领域分布度与有效词频的概念,通过计算候选术语的EC-value值来自动抽取术语,并结合术语簇识别与挖掘,改善低频术语抽取性能。通过计算机领域术语抽取实验,表明本文提出的改进方法(EC-value方法)能更有效地衡量术语的术语性,改善低频术语抽取性能。
引用
收藏
页码:54 / 59
页数:6
相关论文
共 11 条
[1]   基于改进C-value方法的中文术语抽取 [J].
胡阿沛 ;
张静 ;
刘俊丽 .
现代图书情报技术, 2013, (02) :24-29
[2]   C-value值和unithood指标结合的中文科技术语抽取 [J].
韩红旗 ;
安小米 .
图书情报工作, 2012, 56 (19) :85-89
[3]   自动术语识别存在的问题及发展趋势综述 [J].
祝清松 ;
冷伏海 .
图书情报工作, 2012, 56 (18) :104-109
[4]   基于领域中文文本的术语抽取方法研究 [J].
谷俊 ;
王昊 .
现代图书情报技术, 2011, (04) :29-34
[5]   面向领域中文文本信息处理的术语识别与抽取研究综述 [J].
季培培 ;
鄢小燕 ;
岑咏华 .
图书情报工作, 2010, (16) :124-129
[6]   C值和互信息相结合的术语抽取 [J].
梁颖红 ;
张文静 ;
张有承 .
计算机应用与软件, 2010, 27 (04) :108-110
[7]  
基于多策略融合的中文术语抽取方法[J]. 周浪,史树敏,冯冲,黄河燕. 情报学报. 2010 (03)
[8]  
中文术语抽取若干问题研究[D]. 周浪.南京理工大学. 2010
[9]  
基于齐次马尔可夫链的中文新术语识别方法研究[D]. 胡健坤.华南理工大学. 2012
[10]  
语言学文献标题的术语提取研究[D]. 李嵩.山东大学. 2007