基于统计和规则相结合的科技术语自动抽取研究

被引:32
作者
刘豹
张桂平
蔡东风
机构
[1] 沈阳航空工业学院知识工程中心
关键词
条件随机场; 科技术语抽取; 术语识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
科技术语自动抽取是中文信息处理领域的一个重要研究课题,在信息检索、机器翻译等领域,特别是在专利翻译中有着广泛应用。结合专利翻译任务,主要研究专利中科技术语的识别方法,在分析目前已有方法的基础之上,提出了一种使用条件随机场模型进行标注识别,并结合规则对错误识别结果进行后处理的科技术语识别方法。实验结果表明,提出的统计和规则相结合的识别方法是有效的,开放测试结果F值达到了84.4%。
引用
收藏
页码:147 / 150
页数:4
相关论文
共 7 条
  • [1] 领域词汇自动获取的研究
    凌祺
    樊孝忠
    [J]. 微机发展, 2005, (08) : 148 - 150
  • [2] 基于多策略的专业领域术语抽取器的设计
    杜波
    田怀凤
    王立
    陆汝占
    [J]. 计算机工程, 2005, (14) : 159 - 160
  • [3] 基于互信息的中文术语抽取系统
    张锋
    许云
    侯艳
    樊孝忠
    [J]. 计算机应用研究, 2005, (05) : 72 - 73+77
  • [4] 信息技术领域术语提取的初步研究
    王强军
    李芸
    张普
    [J]. 术语标准化与信息技术, 2003, (01) : 32 - 33+37
  • [5] 现代术语学引论[M]. 语文出版社 , 冯志伟著, 1997
  • [6] 术语自动抽取系统的设计及关键技术研究 .2 刘建舟. 华中师范大学 . 2005
  • [7] A statistical corpus-based term extractor .2 Pantel P,Lin De-kang. Canadian Conference on AI . 2001